Sobre el Spam y las Batallas Ganadas

Navegando plácidamente por la red, entre dormido y despierto y un poco lánguido por haber estirado mi rutina matutina (1. ducha, 2.emails, 3. ¿sigo en línea?, 4. desayuno), me topé con un halago que me ha inspirado a compartirles unos detalles sobre el spam masivo que nos afecta a diario.

Hoy me enteré de que Xrumer, uno de los principales programas para distribuir spam automatizado, me ha concedido la batalla, agregando hispamedios.com a la lista de “no spammear porque nos agarran.” La lista cubre portales de desarrolladores de software con suficiente sapiencia y dedicación para perseguir a los agresores spamisivistas (venga, que el idioma lo hacemos nosotros!)
Encabezando la lista vemos a los sitios oficiales de las conocidas plataformas PHP-Nuke y PhpBB, además de otros sitios dedicados enteramente a combatir el spam como Spamhuntress.

Pues es un orgullo estar en tan buena compañía, aunque no estoy seguro de cómo llegué ahí. No es novedad para los que me conocen que le tengo declarada la guerra al spam, pero dudo que Xrumer me tenga miedo exclusivamente por mis posiciones políticas. Es probable que el autor de la lista preste atención a los sitios que reporten agresores y ofrezcan soluciones. Se me ocurre que intenten dejarnos en paz para no incentivar las llamas del contraataque. Lo más seguro es que se hayan dado cuenta que les he bloqueado el acceso.

En fin, banderita blanca o no, hay guerras para las que no existe tregua. Total, ya me ha tocado subir de nivel todas mis cuentas de hosting para lidiar con los desbordamientos de ancho de banda que producen estos sistemas automatizados. Y justo pensando en eso es que escribo este post.

Bloqueando a los spammers
Una de las mejores formas de combatir el spam es tomarse el tiempo de reconocer los IPs agresores y bloquearlos desde el panel de control o el .htaccess. De esta forma minimizamos considerablemente el ancho de banda utilizado en estos ataques ya que en vez de cargar en desperdicio miles de páginas de contenido, el servidor niega completamente el acceso a estos IPs. Así también le damos menos trabajo a nuestras herramientas antispam.

Además, quién sabe, es posible que al reconocer el bloqueo estos programas automatizados dejen de intentar, y con algo de suerte continúen agregando nuestros sitios a las listas negras (blancas?)

Listas Antispam
Hay dos maneras de obtener la lista de los IPs agresores. La más divertida (a mi criterio) es analizar las estadísticas del servidor todas las semanas en busca de los visitantes que se repiten irracionalmente, y luego analizar las acciones de dichos visitantes para establecer cuales son sus intenciones con nuestro sitio.

La otra manera (más fácil) es copiar la lista de alguien que ya haya hecho este trabajo. (Hola!)
Esta es mi lista de IPs bloqueados en Hispamedios:

66.199.232.130
158.37.159.21
70.85.147.66
67.159.44.252
217.20.163.50
208.101.35.52
67.159.45.54
201.240.142.30
220.226.206.227
70.85.147.194
38.114.169.172

Yo solo he bloqueado agresores masivos confirmados, además son solo los que estaban atacando al sitio en cuestión. Algunos de estos atacaban cientos de veces al día (todavía recibo algo de spam de otras fuentes, pero en números más razonables). Le recomiendo ampliamente a todos los bloggers hispanos que bloqueen el acceso a estos IPs.

Hace falta recalcar que me la he llevado fácil. Conozco sitios que se ven obligados a bloquear cientos de IPs, por lo que existen además otras listas. En un sitio en inglés tuve mucho más trabajo, terminé bloqueando más de 40 IPs identificados manualmente, y después me tocó desactivar los comentarios hasta instalar alguna herramienta antispam.

Además estas listas no son definitivas ni la solución al spam – solo otra herramienta efectiva para agregar al arsenal.

Les dejo enlaces a otras listas para los que quieran protegerse al máximo:
* Lista de Rod McFarland – Lista generada automáticamente de IPs que enviaron spamentarios en los últimos 30 días – Universidad Simon Fraser, Canada.
* Blacklists en el Directorio de Google.

5 Técnicas Para Conseguir Tráfico Hoy

Retozando en el foro de Xeoweb – uno de los pasatiempos para los que quisiera tener más tiempo – me topé con un hilo que cuestionaba la existencia del SEO como herramienta de mercadeo. Me pareció impactante que en un foro de SEO alguien con más de un año y 300 mensajes de participación pudiera tener dudas sobre si el SEO existe, pero más que eso me dio a pensar en las razones por las que nuestro compañero había perdido la esperanza y bajado los hombros.

Y sin mucho esfuerzo puedo recordar situaciones en las que he sentido frustraciones similares. A veces se aplican todas las “reglas” que hemos ido recogiendo con el tiempo y parecen no tener el efecto prometido.

Para triunfar en posicionamiento hace falta meterse en un mundo de reglas dudosas, creadas por los aficionados que llegaron antes que uno y han tenido que aprender a punto de prueba y error. Esto no es ciencia exacta en función de que los algoritmos están ocultos y en constante evolución, y el medio sobre el cual trabajamos no nos quiere aquí (los buscadores tuvieran la vida más fácil si nadie supiera de SEO).

5 ideas – Tráfico Ya!
En este post quiero compartir algunas ideas que ayuden a darle un empujón a los que se sientan estancados. De alguna forma podemos considerar estas técnicas como trucos de resultados concretos para acompañar tanta teoría de mercadeo que a veces nos deja en el aire. Aunque todo lo expuesto aquí nos consigue enlaces y ayuda en el posicionamiento, me voy a concentrar en conseguir tráfico inmediato.

Wikipedia
1. Wikipedia
La Wikipedia es una excelente fuente de tráfico porque está en constante uso. Es verdad que los enlaces externos tienen puesto un nofollow, y por esto mucha gente se olvida de utilizar este recurso. Pues bien, el objetivo del mercadeo de un sitio es conseguir tráfico de calidad, y para esto la Wikipedia es estelar.

Un buen artículo de la Wikipedia puede enviarle a un sitio cientos de visitas al día. Sin embargo, no es cuestión de meterle spam a la enciclopedia, porque el spam (es inaceptable – he dicho! -, y además) no dura mucho en una enciclopedia comunitaria en la que cualquier puede corregir las entradas.

Para conseguir tráfico de la Wikipedia hace falta contribuir con algo valioso. Por suerte el rango de temas que se tratan en la enciclopedia es tan amplio que de seguro cualquiera puede encontrar un lugar donde contribuir con sus propios conocimientos (o un tema que vaya de la mano con el sitio que estamos posicionando).

Entonces, mi recomendación es escribir un puñado de artículos de primer nivel con contenido de calidad digno de una enciclopedia, y luego aportar con ese contenido a los artículos de la Wikipedia; y por supuesto, dejar a manera de citación un enlace de regreso hacia la fuente (nuestros artículos), como es la norma cuando se agrega información a la Wikipedia (las citaciones son parte crucial de la calidad de cualquier enciclopedia).

Estas citaciones comenzarán a enviar tráfico de inmediato.

Comunidad
2. Introducción a la Comunidad
Sea cual sea el tema del sitio que estemos posicionando, lo más probable es que ya alguien tenga un sitio al respecto. Yo voy más lejos a sugerir que también es probable que ya existan algunos blogs, foros y comunidades tratando el tema.

Pues bien, tenemos un sitio bueno, con contenido de calidad, sin tráfico. Es posible que los buscadores aún no nos tengan cariño, pero esto no significa que la comunidad no tenga interés en nuestro sitio y su contenido.

Una de las mejores maneras de dar a conocer un sitio es simplemente salir a interactuar con gente del medio. Los blogs aceptan comentarios, los foros aceptan mensajes, etc. Una forma de conseguir visitas de inmediato es encontrar estos recursos y participar (y, por supuesto, dejar nuestra firma).

Ojo, que no hablo de spam, (yo nunca hablo de spam porque como ya dije, no es aceptable, y además) el spam no va a llamar la antención de los participantes favorablemente. El objetivo aquí no es ganar PageRank con enlaces sino incentivar al mundo a pasarse por nuestro sitio. Entonces, la participación en blogs y foros implica aportar a lo que se está hablando con ideas coherentes e inteligentes que llamen la atención o que por lo menos no pasen desapercibidas.

Aquí podríamos entrar un poco en LinkBaiting (armar escándalo a propósito entre otras cosas), pero sin ir más lejos lo que yo sugiero es encontrar blogs y foros de una temática relacionada a la de nuestro sitio y salir a leer el contenido y las ideas de otros y participar con aportes (comentarios y mensajes).

Conforme la comunidad se interese por nuestra participación van a seguir los enlaces en nuestras firmas.

Menéame
3. Sitios Comunitarios de Envío de Noticias
Gracias a Digg, y en especial a Menéame, hemos visto una explosión de sitios en los que la comunidad contribuye con noticias y elige lo que va a la portada.

Contribuir en sitios como estos nos provee de enlaces y tráfico instantáneo. El volumen y calidad de tráfico depende de la calidad de la “noticia” que estemos aportando.

Mi recomendación es identificar estos sitios, analizar el tipo de noticias que van bien con la comunidad de cada uno, y aportar en los sitios en los que el contenido del nuestro pudiera tener una buena acogida. También recomiendo escribir artículos en nuestro sitio específicamente diseñados para agradar a los usuarios de estas comunidades (y, por supuesto, enviar dichos artículos como noticias).

Blog
4. Inicia un Blog
Muchos sitios no son blogs, y no tienen blogs. ¿La razón? No hay razón. La excusa es que son sitios comerciales o dedicados a algo específico como una herramienta o cualquier otra cosa que no se preste al estilo tradicional de un blog.

Pues bien, el blog no tiene que ser la potada del sitio. Tampoco hace falta que sea parte importante del sitio ni siquiera que hable de lo mismo de lo que trata el sitio.

Existen varias formas de llevar un blog. Puede ser un blog temático, directamente relacionado con el tema general de nuestro sitio. Así puede ser un blog técnico, o un blog de ideas y consejos, o un blog sobre la opinión del director de la empresa o sitio con respecto a los servicios de la empresa o sitio.
Puede ser un blog de noticias, sobre lo que está haciendo la empresa y los planes a futuro. Puede ser un blog sobre noticias temáticas para mantener a la comunidad informada sobre los acontecimientos relacionados con el tema del sitio.
Puede ser también un blog personal con información curiosa sobre la vida de las personas que están detrás del sitio. En fin, contenido constante.

El tener un blog permite (entre otras cosas) beneficiarse de los directorios (y buscadores) de blogs y tags, que son muy activos y fácilmente pueden enviar cientos de visitas al día (por no decir miles) y mejorar el PR otorgándonos un montón de enlaces. Un blog puede empezar a recibir tráfico de estos directorios desde el momento en que empieza a generar contenido.

Offline
5. Mercadeo Fuera de Internet
No todas las gestiones tienen que ser electrónicas. Existen formas de conseguir tráfico y promocionar un sitio fuera de Internet. La creatividad manda en este tipo de mercadeo estilo guerrilla (si se lo desea hacer manteniendo la inversión al mínimo). En realidad se puede hacer de todo.

Un paso inicial es poner la dirección del sitio en nuestras tarjetas de presentación, y luego salir a participar con la comunidad en vivo. Ferias, eventos, seminarios, patios de comida, etc… hay un montón de situaciones en las que podemos entablar conversaciones sobre nuestro sitio. La diferencia es que una conversación uno a uno solo nos consigue una visita, pero va a ser una visita con mucho interés. No se trata de alguien que dio con nuestro sitio tras una búsqueda rápida, sino de alguien que ya asocia nuestro sitio con su propia realidad.

Una forma de mercadeo guerrilla simple es imprimir nuestra dirección en hojas o afiches o volantes y encontrar formas creativas de distribuirlos. Tableros de anuncios, postes de luz, ascensores… cualquier lugar. Es sorprendente la cantidad de establecimientos comerciales que permiten dejar volantes en un mostrador.

En fin, este tema del mercadeo guerrilla es muy largo y sin duda brinda resultados. La regla es simple: a mayor creatividad mejores resultados.

Recursos:
Referencia Rápida sobre edición de la Wikipedia
– Búsqueda en blogs: Google Blog Search, Blogalaxia, Technorati
Lista de clones de Menéame (más de 260)
Instalación de un Blog: 40 Tips Practicos
Sobre Google y la Indexación del Contenido (aquí doy consejos para blogs y hablo sobre los directorios de blogs y tags)
Ideas de Marketing Guerrilla para encender la creatividad

Sobre Google y la Indexación del Contenido

Por estos días he estado jugando con Google a las “indexadas” y he visto una gran diferencia en la indexación de contenido fresco vs. estático o de poca actualización. Esto es algo de lo que siempre se habla pero no dejan de existir preguntas. Espero con este post ayudar a esclarecer dudas y ofrecer algunas ideas útiles.

Antes que nada aclaro que con indexación me refiero a la habilidad de un motor de búsqueda de encontrar nuevas páginas, y también de encontrar cambios en páginas que ya están en el índice.

Pues bien, con el propósito de hacer pruebas con respecto a la aplicación del nofollow, he creado varias páginas y les he puesto un enlace desde una página PR3 y también otro enlace desde un sitio bastante concurrido en una página PR6. Esto sucedió hace 4 días y, para mi sorpresa, sigo esperando que Google – o cualquier otro buscador – indexen mis páginas.

Mis falsas expectativas estaban fundadas en que por lo general a Google no le toma más de dos días dar con mis actualizaciones, y me esperaba aún un mejor desempeño tratándose de una página PR6. Sin embargo, debo admitir que si mi intención era conseguir resultados veloces ha sido error mío poner los enlaces en páginas de poca actualización. La PR3 no ha visto una actualización en meses, y aunque la PR6 recibe pequeñas modificaciones constantes, en general el 90% de su contenido se ha mantenido íntegro por tal vez años.

Por otro lado, justo la semana pasada estuve ayudando a lanzar un sitio, PR0 por supuesto, y hoy he visto que Google indexa las páginas nuevas con un día de atraso y la portada en tan solo horas.

Entonces, ¿Cómo se consigue indexación de primer nivel?
La solución está dada en 2 aspectos muy simples:

Mucho Contenido
El sitio que estamos lanzando ha generado alrededor de un ciento de páginas de las cuales ya 87 están en el índice de Google (Yahoo solo reconoce 3 páginas, pero vamos! Yahoo en la primera semana? Vaya triunfo!). Tal volumen de contenido significa que la portada siempre le tiene alguna novedad al robot de Google, y un robot inteligente toma nota y se propone visitar con más frecuencia.

Muchos Enlaces
Sin enlaces de qué alimentarse los buscadores no pueden encontrar páginas nuevas, ni les dan autoridad a lo que encuentran. En el caso de un blog, el primer paso es registrarse en todos los directorio de blog que estén a la mano. Yo recomiendo Blogalaxia y Bitacoras, pero esto es solo el inicio. Existen decenas de directorios hispanos, y aún más en inglés que igual cuentan, como Technorati y Rel8r que me envían visitas con regularidad.

Ahora bien, Technorati, por ejemplo, es más conocido por su directorio de tags, y éste es el segundo aspecto importante al registrarse con directorios de blogs. Un directorio de tags significa un enlace más para cada tag que le pongamos a un post. En un directorio de prestigio, cada uno de estos tags puede significar un enlace PR3 aunque solo sea por un par de días y después pase a una página de archivo menos importante (talvez PR2).
Entonces, si estamos registrados en 10 directorios de blogs y tags, y hacemos 10 entradas al día, cada una con 5 tags, estaremos recibiendo en promedio 500 enlaces entrantes al día, gratis.

Así que Google actualiza mi nuevo sitio a la fuerza, quiera o no. No importa que es nuevo, ni que tiene PR0, ni si el contenido es de calidad o de confianza… al diablo el TrustRank. Lo único que Google sabe es que mi sitio recibe cientos de enlaces nuevos cada día, y no le queda más que pegarme una visita – o 903 durante la semana, según las estadísticas del servidor.

Claro que todo lo demás sobre el posicionamiento aplica. No basta con aparecer en el índice, hay que ganarse un puesto con variedad de enlaces, optimización onsite, etc, pero en cuanto al tema en cuestión, conseguir una indexación constante, los blogs tienen una ventaja tremenda si la saben poner a disposición.

Por cierto, Google nos ha mandado 555 visitantes en la primera semana. 😀

Les dejo dos enlaces de interés para los que no los conozcan y quieran ganarse un empujón inmediato: Ping-o-matic y Pingoat son dos “pingers” automáticos que notifican a un montón de directorios de un solo ataque. (En muchos de estos directorios hace falta estar registrado para que el ping sirva de algo, pero en otros como Technorati el ping es suficiente para ganarse un puesto).

El Generoso Youtube y Sus Enlaces Recíprocos Unidireccionales

¿Enlaces recíprocos unidireccionales? No es error lógico o tipográfico, me explico:

Youtube no necesita presentación, se trata del afamado subsidiario de Google que permite subir videos a Internet de una manera muy conveniente. El sistema permite también insertar dichos videos en cualquier página web, por lo que vemos estos videos con regularidad en blogs de todo tipo.

Lo que no todos saben es que Youtube lleva un registro de los videos que han sido insertados en otros sitios, y con gran generosidad pone un enlace apuntando de regreso a la página donde se insertó el video.

Ahora bien, aunque se trata de un enlace recíproco ya que estos videos de Youtube tienen un enlace interno hacia la página madre, dichos enlaces están dentro de la aplicación Flash y no deberían acarrear el peso normal de un enlace en cuanto a buscadores se refiere. Sin embargo, el enlace que Youtube pone en agradecimiento hacia nuestro sitio sí es un enlace HTML común y silvestre (aunque con nofollow), por lo que aparece como enlace entrante en los resultados de los buscadores. Por esto es que yo los llamo enlaces recíprocos unidireccionales.

Para celebrar la ocasión y hacer una demostración, he invertido un par de horas en crear un video tutorial explicando cómo funciona el proceso. Ojalá les guste: 😀

Por último, aunque yo me he tomado la molestia de crear un video, basta con insertar cualquier video para obtener el enlace recíproco. Sin embargo yo recomiendo crear videos originales, tanto porque es una manera interesante de invertir el tiempo, y porque un buen video – debidamente marcado con el logo y URL de nuestro sitio – puede atraer un flujo constante de visitas desde Youtube. Además los video-tutoriales son más entretenidos que el texto simple, y seguro los visitantes los recibirán con aprecio. ¿Opinan igual?

Ah Caray! El Ataque del Hoteldipity Masivo

Y seguimos llenando la red de basura electrónica a diestra y siniestra, cortesía de los concursos de posicionamiento y la falta de escrúpulos de sus participantes. Sin embargo, aún en mi estado más pesimista, tengo que agradecer a hoteldipity y todos su secuaces por el volumen de estadísticas de posicionamiento con la que aportan estos concursos y lo que ya se puede ir aprendiendo de los resultados hoteldipitescos.

Lo que se gana siguiendo de cerca estos concursos a menudo me hace pensar que valió la pena el esfuerzo colectivo (aún cuando tengo una firme vendeta en contra de este tipo de spam). Mientras el concurso está en progreso podemos ir viendo como se comportan Google y otros buscadores ante las gestiones que los concursantes hacen a diario.

Entonces, ¿cómo se gana un concurso SEO? (o ¿cómo se posiciona una de las palabras con mayor competencia en la actualidad?)

Pues la mayoría empieza por iniciar un blog y llenarlo de posts con entradas sobre-hoteldipitadas. Se empieza por títulos como “Japón trata de recuperarse de un hoteldipity de 6,8 grados”. La nota debe llevar, por supuesto, no menos de 3 o 4 referencias directas a la palabra hoteldipity apuntando a la página que se está posicionando. Así mismo es importante poner enlaces globales en el sitio, apuntando hacia dicha página.

El segundo paso es llenarse de enlaces entrantes provenientes de los mejores lugares que se pueda conseguir. Una de las soluciones más fáciles es incurrir en enlaces recíprocos con otros concursantes. Seguro hay que apuntarse en todos los directorios, y si es posible spammear Meneame, Fresqui, y cualquier otro portal que acepte un enlace.

Hasta aquí las técnicas que menciono son de conocimiento general, pero hay mucho en los ajustes. ¿Cual enlace vale más?, ¿Cuantas veces se puede repetir una palabra sin arriesgarnos a penalizaciones por contenido falso?, ¿Cuanto valen los enlaces recíprocos?, ¿Vale más un dominio .com que un .com.es?, ¿Vale más un blog gratuito en Blogger que uno en WordPress?

En lo personal veo tanta información útil que podría pasarme un mes solo haciendo estudios. Voy a seguir el concurso de cerca para compartir mis hallazgos al final del proyecto, pero ya les comparto algunos detalles interesantes con los que me he topado hasta el momento.

Al buscar hoteldipity en Google.com el primer resultado que veo es de Youtube:
Hoteldipity En Google

Partiendo de la idea que Youtube no está tratando de llevarse el premio, asumo que alguien decidió subir un video para spammear Youtube a cambio de los enlaces recíprocos que este sitio entrega generosamente. Hasta el momento hay 5 sitios disfrutando de este empujón (presten atención los que están concursando – solo hace falta insertar el video en un página para recibir el enlace recíproco).

Lo que me hace gracia es que esta página aparece primera a pesar de ser las más inocente del top 10.
Y luego vienen las preguntas. Está claro que Youtube como sitio en general tiene mejor posicionamiento que cualquiera de los blogs creados para efectos del concurso, sin embargo esta página de Youtube no se ha beneficiado de una gestión de mercadeo. ¿Cómo es posible que aparezca por encima de los otros sitios?
Esto nos da para pensar sobre las leyendas de las penalizaciones por falta de antigüedad (o empujones para los sitios con mayor antigüedad), el verdadero peso de los enlaces entrantes unidireccionales y recíprocos (¿existirá una limitación en cuanto a su aporte de PR basado en la antigüedad de dicho enlace?), entre otras cosas.

¿Y que hay de hoteldipity.com? A punta de adivinanzas educadas yo hubiese apostado que un sitio .com tendría mejores resultados que uno servido desde un servidor gratuito. Sin embargo hoy lo veo en la posición 56. (Por cierto, veo también a SEOProfesional.com en la posición 50 gracias al esfuerzo desinteresado de nuestro colega Duque – y nótese que Ferran fue el primero y único en clavarle un spammentario, con fines pedagógicos sin duda alguna.)

Yahoo Search muestra al rededor de 57 enlaces entrantes al sitio, mientras que otro concursante, hoteldipityseo.blogspot.com, se acomoda en la posición #2 con tan solo 5 enlaces entrantes. ¿Qué significa esto? En mi humilde opinión, y recordando que a estas alturas no ofrezco más que especulaciones, pienso que la gran ventaja que tiene el blog en la segunda posición sobre hoteldipity.com está dada en el volumen de contenido (que significa también mayor volumen de páginas y enlaces) y el empujón que recibe un blog por crear contenidos frescos a diario. Por otro lado, hoteldipity.com pudiera estar penalizado por su estructura de enlaces recíprocos y la desesperante cantidad de veces que se repite la palabra hoteldipity tanto en el contenido como los enlaces del sitio.

Hasta aquí con mi análisis preliminar. Estoy consciente que suelo extenderme y no faltará quien quiera recordarme que esto es un blog y no mi tesis de grado, así que los dejo con un disclaimer: como estoy de especulaciones seguro en algo me he equivocado, pero no hay nada más entretenido que aseverar sin bases firmes, así que los invito a todos a especular conmigo sobre las estadísticas de este concurso.

Y por cierto, para el que no se fijó, este post es mi aporte hoteldipitista experimental.
😀

Google disminuye el impacto de los Googlebombs

Los Googlebombs (o linkbombs) son “ataques” deliberados a una página con el propósito de posicionarla para términos que no están en dicha página y que por lo general tienen connotaciones humorísticas o negativas. Uno de los ejemplos más importantes era el del auto proclamado “presidente del mundo”, George W Bush, cuya biografía aparecía en primer lugar para la búsqueda en inglés “fracaso miserable” (miserable failure).

Esto sucedía porque cientos (o miles) de detractores enlazaron hacia la página oficial de la Casa Blanca con el texto en cuestión, y aunque este no aparezca en dicha biografía, el peso del texto de los enlaces en conjunto con la poca competitividad para dicha expresión lograron posicionar bien la broma en todos los buscadores.

Por divertido que esto sea, no deja de causar problemas en varios aspectos. Por su parte Google recibía quejas constantes de personas que asumían se trataba de una posición política por parte del buscador. En respuesta a esto decidieron agregar un pequeño mensaje que aparecía en las búsquedas que el motor reconocía como Googlebombs y explicaba que si los resultados parecían extraños no era culpa de ellos. También explicaban que aunque no les costaba nada interferir en casos conocidos, Google prefiere implementar siempre algoritmos a gran escala que corrigen automáticamente todos los problemas de un tipo en lugar de lidiar con cada instancia manualmente.

Ahora han dado el siguiente paso. Justo ayer la central para webmasters de Google anunció que han optado por implementar un algoritmo que reducirá el impacto de los Googlebombs, lo que significa que a los webmasters se nos acabó la broma con Google, y talvez esto también signifique que el texto en los enlaces pesará menos para expresiones que no se encuentren en el contenido de las páginas a las que apuntan.

Pero para el señor Bush el chiste seguirá siendo divertido, porque aunque la expresión “Googlebomb” puede estar viendo sus últimos días, la estrategia que ahora renombraremos como linkbomb sigue perfectamente en pie, ya que el “fracaso miserable” continúa apareciendo en el primer puesto en otros buscadores como Yahoo, MSN, Altavista, AllTheWeb, LookSmart, etc.

Por qué la publicidad contextual y la oferta de servicios se contradicen

El modelo de publicidad contextual, a menudo descrito como sitio Adsense, depende de un volumen alto de tráfico interesado en el tema del que trata la página de “aterrizaje”, con el propósito de que los visitantes sean expuestos a publicidad relacionada con lo que están buscando y se vayan del sitio a través de dicha publicidad en Internet.

Entonces, para un sitio cuyo modelo económico se basa en publicidad contextual, los visitantes son sólo útiles cuando optan por la publicidad en lugar de seguir explorando el sitio, y el contenido del sitio solo sirve para atraer usuarios pero no para retenerlos.

En general un sitio siguiendo este modelo no necesita ser confiable ni gozar de reputación alguna. Basta que exista y que se posicione adecuadamente, lo suficiente como para atraer visitas que ojala se vayan casi por donde vinieron; ya que si el visitante encuentra en el sitio lo que estaba buscando, entonces se quedará en el sitio en vez de buscar más información a través de la publicidad resultando en menores ingresos para el sitio.

En contraste, un sitio cuyo modelo comercial se basa en la oferta de productos y servicios genera sus ingresos cuando los visitantes pasan a ser clientes. Para lograr este tipo de conversión hace falta mucho más que solo atraer al visitante. Un sitio así necesita lucir confiable, convincente y profesional – debe ganarse al visitante. El contenido del sitio debe despertar el interés del cliente prospecto, quién probablemente analizará algunos artículos y secciones antes de empezar a considerar contratar los servicios del sitio, y solo se convertirá en cliente si queda convencido de que el sitio en cuestión va a satisfacer sus necesidades.

Si un sitio como éste tuviera publicidad en Internet contextual estaría ofreciendo atractivos enlaces de salida a los mismos visitantes que intenta retener. Peor aún, estaría muy a menudo ofreciendo los servicios de la competencia en las mismas páginas en las que ofrece sus propios servicios, arriesgándose a perder ante una oferta mejor o más interesante a cambio de una fracción de los ingresos que provendrían de cerrar una venta.

En resumen, un sitio que ofrezca productos y/o servicios probablemente no debería mostrar publicidad, y sobre todo no publicidad contextual.

Search Wikia: Análisis sobre un posible buscador con motor social

Hace unos días se publicó en SearchEngineLand una entrevista con Jimmy Wales, cofundador de la Wikipedia y director de la compañía Wikia con la que tiene planes de lanzar un buscador que organizará sus resultados utilizando conceptos sociales aprendidos con la enciclopedia. Con las respuestas de Wales es posible formarse una idea de dónde se encuentran y hacia dónde se dirigen.

En la actualidad el proyecto (conocido anteriormente como Wikiasari) está recién en fase de planeamiento, aunque ya cuenta con más de $4 millones de presupuesto mayormente financiados por Amazon. En vista de que aún no se cuenta con un plan claro, muchas de las preguntas que tenemos para Wales no reciben respuestas contundentes, y se puede notar algo de idealismo infundando en muchas de sus opiniones.

Sin embargo, algunas de las premisas tienen sentido. Buscadores como Google hacen un gran trabajo de devolver resultados relevantes para muchas solicitudes, pero fallan miserablemente en muchas otras. Además, el esquema de funcionamiento que hace a Google destacar hoy en día podría estar limitado intrínsecamente, y es posible que una solución que incluya participación social por encima de algoritmos complejos brinde mejores resultados.

Prueba #1: Spam
Uno de los principales problemas que tiene un buscador es el spam de todas las formas. Están desde sitios que tienen contenido real y buscan empujarse un par de peldaños en los resultados, hasta sitios cuyo contenido es una descarada generación matemática de palabras clave sin sentido semántico, y que como método principal de promoción se dedican a llenar la red de enlaces no bienvenidos.

Para que un buscador funcione, no solo debe ser capaz de encontrar resultados relevantes entre las páginas genuinas en su índice, también debe ser capaz de reconocer el alto porcentaje de páginas que son solo spam y mantenerlas fuera de los resultados. Esto no es un asunto nuevo y vemos a los principales buscadores de hoy entablar una fuerte lucha a diario, con resultados mayormente positivos pero no perfectos.

Wales pretende resolver el problema del spam utilizando esfuerzo comunitario. Aunque él mismo no tiene claro en que forma podría funcionar esto, entre sus ideas especula que los usuarios podrían identificar a los sitios de spam y marcarlos como tal para que sean separados de los resultados. El problema con este método es que exige que se marque a todos y cada uno de los sitios manualmente, a diferencia de sistemas como el de Google que utiliza algoritmos avanzados para reconocer automáticamente a sitios dudosos. Además, permitir que usuarios intervengan en la penalización de sitios abre una caja de Pandora completamente nueva sobre problemas de manejo de comunidades con los que Google no tiene que lidiar y que hemos visto causar quizás aún más daño en la Wikipedia de lo que el spam le causa a Google.

Prueba #2: Recursos
Otra dura prueba que el Search Wikia tiene por delante es abastecerse de los recursos necesarios para competir con los gigantes que hoy gobiernan en el reino de las búsquedas.

Google aparenta tener el mayor índice de todos los buscadores, número que se mide – por su puesto – en billones de páginas que deben ser visitadas periódicamente, analizadas y reincorporadas al índice. Asumiendo que se dispone de una granja de servidores con la capacidad de almacenar una copia y respaldos de todo el Internet, el paso más duro es responder a solicitudes de búsqueda y devolver resultados adecuados instantáneamente basados en tremenda pila de información.

Google lo hace ver simple, pero nada más lejos de la realidad. Alcanzar el tipo de optimización y personalización de algoritmos para llegar a tal nivel de desempeño requiere una inversión en personal y conocimientos difícil de solventar con $4 millones que de seguro se irán solo en la adquisición y alojamiento de los primeros servidores experimentales y el sueldo de un puñado del equipo de desarrollo. Ni hablar de los gastos de adquisición y mantenimiento de la tremenda infraestructura, ni de los costos de los equipos, ni del ancho de banda necesario para visitar el Internet completo varias veces a la semana.

No todo es cuesta arriba
Aún teniendo en cuenta todos los problemas que esperan con ansias a quien intente competir con Google, Jimmy Wales tiene muchas cosas a su favor. En primer lugar está su indudable experiencia gestionando redes sociales, siendo el cofundador y planeador de la Wikipedia; sitio que probablemente es el primer y más importante exponente de un proyecto basado en colaboración social que ha rendido grandes frutos.

Sin duda no es extraño al requerimiento de recursos, considerando que aunque la Wikipedia no es sino una minúscula fracción de lo que es la Web entera, sabemos que sostiene algunos millones de páginas y da servicio a un tráfico exorbitante. Tampoco es extraño a organizar comunidades y sacar adelante proyectos novedosos.

Conclusión
En mi opinión hay un largo trecho que recorrer antes de que el Search Wikia pueda ser reconocido como un buscador entre los grandes, y sabemos que habrá que esperar algunos años antes de verlo funcionando en toda su gloria. Sin embargo, si la idea de un buscador basado en aportaciones comunitarias es gestionable, ¿a qué otra persona querríamos encomendarle la labor?

Por ahora nos queda esperar, y para los más aventureros echar una mano.