Archivos para septiembre 20th, 2007

Wordprexy.com y de como clonar todo WordPress.com

septiembre 20, 2007

Si aún no se han enterando, Wordprexy.com es un sitio que está duplicando el contenido de todos los blogs hospedados en WordPress.com, sin pedir permiso alguno agregando anuncios, duplicando el contenido respecto a buscadores y quedándose con el tráfico de los blogs que han duplicado.

La historia detrás de Wordprexy y del por qué están copiando todos esos blogs, es debido al bloqueo que Turquía le ha impuesto a todo WordPress.com bajo alegatos de que es muy facil crear un blog difamatorio en contra de una persona muy influyente (supongo yo) que presento su queja ante un tribunal y este ordenó el bloqueo de todos los blogs hospedados acá, limitando así la libertad de expresión en aquel país.

Según declaron ellos, no están tratando de robar contenidos si no su intención es evadir el blogqueo impuesto por Turquía, y los anuncios que muestran son solo para pagar las cuentas de sus servidores. Todo creo que estaría bien si no mostrarán anuncios en los contenidos y esfuerzo de otros.

Si bien mantener un sitio con 12 millones de páginas vistas, como aseguran, es algo un tanto difícil; no creo que sea tan difícil pagar los $20 que les costaría el primer año de hospedaje en Dreamhost (si son pilas y buscan descuentos), quienes son los que dan el hosting según se ve en el registro whois del dominio (en la configuración de los nameservers).

A muchos no nos gustan los anuncios en los blogs, peor aún si vemos que alguien más toma el contenido que hemos escrito y se gana algunas monedas extras cuando ni siquiera nosotros podemos ganarlas en WordPress.com.

A pesar de que hay una buena intención en la idea, sigo viendo a Wordprexy.com como otro pinche scrapper/spammer aprovechado.

Para mí que ellos deberían detectar la IP de donde viene el visitante, si es de Turquía le presentan la página espejo, sino lo fuera deberían de redirigir al blog legítimo ya que no se vería afectado por el bloqueo y no se afecta al autor original del blog con la perdida de tráfico.

Algo que me pareció bastante curioso fue ver que aquellos blogs que han comprado Custom CSS no muestran correctamente los estilos y los anuncios de adsense, después de todo no clonaron todos los blogs correctamente. Aquellos que tengan un dominio para su blog, pues no perderán todo el tráfico ya que solo están remplanzando *.wordpress.com por *.wordprexy.com, así que aún pueden ganar algunos entrantes adicionales.

Mi blog está duplicado, ¿Qué puedo hacer?

Si no estas de acuerdo con las acciones de Wordprexy.com y sientes que duplicar tu blog no es legar, afortunadamente no todo está perdido. Yo mismo tuve mis reservas de las intenciones de esta gente, así que de todos modos les escribí en el formulario de contacto que ellos proveen y solicite que dieran de baja mi blog en su proxy:

Hi guys,
I’ll ask you to stop mirroring my blog: jaroche.wordpress.com in your servers, I don’t wanna get banned by google and other search engines by your duplicate content; and as I never have been asked for this, now I wanna you stop this.

Thanks for your collaboration,
–Javier Aroche

Al cabo de unas horas la copia de mi blog estaba fuera, mostrando el mensaje que yo les escribí. Otros amigos les han escrito y wordprexy los ha elimando rápidamente, después de todo hay buenas intenciones.

Si tienes dudas de si esto es legal o no, yo te recomiendo escribirles (no es necesario que des tu dirección de correo por aquellas) y solicitarles de buena manera que den de baja el espejo de tu blog, parece que atienen estas solicitudes sin mayor problema.

Lo mejor sería que el mismo WordPress.com bloqueara el acceso de los servidores de Wordprexy.com e impidiera que sigan copiando los contenidos de los blogs acá hospedados, pero según me contestaron en los foros y via correo electrónico dicen que esto está fuera de sus manos y que en todo caso hay que escribir a Dreamhost con todo y cartas DMCA solicitando el respectivo cierre.

Pienso que WordPress.com podría bloquear la clonación de blogs al limitar las IPs de los servidores involucrados, pero parece que no quieren meterse en esos asuntos…. Quizás sea hora de escribir a Dreamhost.

¿Wordpress.com hackeado si o no?

Inicialmente varios bloggers pensaron que se trataba de algun hack a Worpdress.com o alguien del equipo facilito el acceso a las bases de datos. Pero como se lo mencione a David, el tamaño de WordPress.com es enorme. Tienen unas 4,096 bases de datos distribuidas en 3 DataCenters, con más de un millón de blogs y muchos más miles de posts, toda esa información no la copias de la noche a la mañana y la pones en un hosting como Dreamhost.

Ellos deben estar usando algun tipo de CDN o script que les facilite copiar los contenidos generardos por WordPress.com y hacerlos pasar a nombre Wordprexy.com con algunos anuncios de Adsense; es lo que supongo por el cache que están manejando en las páginas y por los problemas con el Custom CSS que algunos blogs tenemos comprado.

En fin, mientras unos apoyan la protestas, otros ven como su trabajo es duplicado; yo por mi parte ya solucione el problema y veo que cualquiera lo puede hacer basta un mensaje para que te den de baja; aunque sigo pensando que después de todo van a sacar buenas monedas si tienen tanto tráfico como dicen tener. Google como siempre ya los está indexando, casi 20,000 páginas hasta el momento.

Via: Javier Aroche

Si has disfrutado este post Suscribete al boletin de Novedades de Soy donde no pienso

AddThis Social Bookmark Button

Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

Únete a otros 1.492 seguidores