jueves, octubre 22, 2009

Nos hemos trasladado.

cambio de sitio webPor fin he encontrado el momento de poder exportar este blog a su nueva ubicación http://irsweb.es, nuevo sitio web donde además del blog intentaremos recopilar más recursos sobre la Recuperación de Información, tal como es el repositorio específico de documentos sobre evaluación de la RI.


Os esperamos,

Javier

miércoles, septiembre 30, 2009

¿Qué es un "vínculo profundo"?

Leo en Ojobuscador una breve noticia acerca de que Bing aumentará la información procedente de los "vínculos profundos" (o 'deep linking') de un sitio web recuperado. Lo cierto es que de la noticia no llego a enterarme de nada (excepto de que comentan que la tecnología no es nueva) hasta que rastreo "profundamente" por la web y en un foro encuentro la definición de ese tipo de vínculo que llega tan hasta dentro que se califica como "profundo". La misma es muy simple, porque "realmente los vínculos profundos no son más que hipervínculos normales y corrientes, que en lugar de vincular con la página principal de la web externa lo hacen a una de las páginas interiores".

Sin tener muy claro dónde está la noticia, presto atención al ejemplo que aparece en el post original de Bing community:



Y entonces ya tengo claro lo que son esos vínculos profundos, las secciones previamente identificadas de un sitio web localizado. El buscador no sólo nos lleva a la home page sino que muestra los sitios (supongo) más visitados del portal.

Más que sorprenderme que Bing vaya a usar estos hiperenlaces como fuente de información, lo que me llama la atención es que no los usara hasta ahora. ¿O no?

viernes, julio 10, 2009

Clustering engines.

Esta tarde he visto una expresión que me ha llamado la atención: "clustering engines". Se trata de aquellos IRSWEB que "habitualmente presentan sus resultados de búsqueda en formato de un mapa de dos dimensiones sobre el que se puede navegar a través del mismo en busca de la mejor respuesta" (ReadWriteWeb). Los motores de búsqueda como KartOO y Quintura son excelentes ejemplos. Es curioso el sistema KartOO que para unos autores es buscador y para otros metabuscador (como ya hablamos hace tiempo en otro post).

Imagino que casi todos lectores de este humilde blog tienen claro lo que es el clustering, pero como es un término utilizado en varias áreas científicas y técnicas, os dejo la definición que Wikipedia hace de los algoritmos de agrupamiento (clustering): Un algoritmo de agrupamiento (en inglés, clustering) es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes. Un algoritmo de clustering permite extraer representantes de un conjunto de datos, que pueden ser posteriormente usados para transmisión, para eliminación de ruido o con una fase posterior de calibración, para clasificación de vectores en diferentes conjuntos.

domingo, julio 05, 2009

Lucha de gigantes.

Hoy he leído en El País (curiosamente en su edición impresa que es domingo y estoy en la playa), un interesante artículo sobre las diferentes estrategias de Google y Microsoft para "dominar el mundo" a partir, especialmente, del lanzamiento hace poco más de un mes del nuevo buscador Bing. Lo copio (también lo enlazo desde el título de este post):

Estrategias de titanes

Microsoft y Google rivalizan por el mercado de los buscadores

DAVID ALANDETE - Washington - 05/07/2009

En su permanente juego de estrategia en la Red, los dos titanes de Internet han intentado atacarse mutuamente donde más duele. Microsoft ha presentado un buscador llamado Bing que ha resultado tener un discreto éxito entre los usuarios que recelan de Google.

En su permanente juego de estrategia en la Red, los dos titanes de Internet han intentado atacarse mutuamente donde más duele. Microsoft ha presentado un buscador llamado Bing que ha resultado tener un discreto éxito entre los usuarios que recelan de Google. Esta última empresa, por su parte, ha decidido orquestar una enérgica campaña de relaciones públicas para popularizar su propio explorador web, llamado Chrome, una suerte de Internet Explorer moderno y del siglo XXI.

Bing acaba de cumplir un mes. El 28 de mayo sustituyó a Microsoft Live Search, un buscador que pasó a mejor vida sin pena ni gloria, estancado en un 8% del mercado. Microsoft tenía acostumbrados a los internautas a productos más bien discretos. El hecho de que Bing funcionara, es decir, que ofreciera resultados relevantes con un diseño sencillo y que no interfiriera negativamente en la navegación, fue toda una novedad.

Microsoft, según calculan los analistas, se ha gastado unos 70 millones de euros en promocionar Bing. El tabloide The New York Postweb", decía el periodista James Doran. publicó el pasado 14 de junio una noticia adornada con un montaje fotográfico en el que enfrentaba la cara de Steve Ballmer, consejero delegado de Microsoft, a la de Sergey Brin, cofundador de Google. "Brin está tan nervioso por el lanzamiento del buscador del rival Microsoft que ha reunido a un grupo de ingenieros para que acometan modificaciones urgentes en su servicio

En realidad, Google no tiene de qué preocuparse, de momento. Tiene una sólida posición en el mercado, donde canaliza el 60% de las búsquedas sólo en EE UU. Sin embargo, algo debe haber despertado Bing en aquella compañía para haber provocado una respuesta de su propio consejero delegado, Eric Schmidt. En una entrevista con Fox Business dijo, a principios de mes: "Copiarnos es difícil. Nosotros invertimos todo nuestro tiempo en lo que siempre hemos hecho: innovar. No creo que la llegada de Bing cambie lo que hemos estado haciendo".

En los primeros días de vida de Bing, Microsoft volvió a ser momentáneamente aquella empresa de los años noventa de prácticas sospechosamente poco competitivas. Los usuarios que tenían instalado Internet Explorer 6 veían cómo su página de inicio era sustituida por una y sólo una: Bing.com. No es un asunto menor. Según la consultora Forrester Research, el 60% de los negocios norteamericanos usan todavía Internet Explorer 6, aunque la empresa ya haya difundido la versión número 8 de ese explorador.

Estas prácticas, conscientes o inconscientes, retratan a un Microsoft realmente necesitado de tener algún éxito en el mercado de los buscadores online. Pero por una cuestión de relaciones públicas. La empresa todavía controla el 65% del mercado de los exploradores, según Net Applications. Firefox, de Mozilla, goza del 22%; Safari, de Apple, del 8%, y Chrome, el retoño de Google, del 1,8%.

Chrome es un navegador lanzado el pasado otoño de diseño moderno y minimalista, con el marchamo de Google. Carece de página de inicio. Pero la barra de navegación es en sí misma un buscador de Google, un ejemplo total de sinergia entre este producto y el famoso motor de la empresa. Es, además, uno de los poquísimos productos para los que Google ha hecho publicidad en medios tradicionales como cadenas de televisión, en Japón, o páginas web de diarios, en EE UU.

En el ámbito de los exploradores, Microsoft no tiene de qué preocuparse. Firefox sigue siendo una amenaza más sólida y creíble. A la vez, Yahoo! es un adversario más temible para Google en el mercado de los buscadores. Parece que los dos titanes de Internet permanecerán enrocados todavía por mucho tiempo, rodeados de peones. De momento, no hay jaque mate en la Red.

Algunas de estos comentarios ya los hemos planteado nosotros en esta web y también hemos recogido notas de otros autores. Parece bueno que los grandes de la Informática no se duerman en los laureles y sigan introduciendo mejoras en sus IRSWEB.

Y emulando a Juan Carlos en su blog Basketmaniaco y aprovechando el parecido del título del post con una preciosa canción, os dejo un vídeo que seguro gusta más que mis humildes comentarios.

miércoles, junio 03, 2009

He liberado mi libro sobre Recuperación de Información.

bookcrossing logoTras diversos avatares he decidido liberar todos mis derechos sobre este libro que elaboré hacia el año 2004 y hacerla pública a través de esta web. El objeto de la misma, en una primera instancia, no es otro que presentar parte del material que recopilé para la realización de mi tesis doctoral en un formato más dinámico e interactivo que habilitar el acceso al documento en PDF. Con el tiempo espero ir actualizando e incorporando nuevos contenidos a esta publicación, de manera que la misma llegue a convertirse en un material de referencia válido para todos los estudiantes en este campo.

En esta versión preliminar, esta publicación constará de Prólogo, los tres capítulos principales (los casos prácticos se refundirán en el nuevo texto) y la Bibliografía. No me cierro la posibilidad de actualizar este manual e incorporar un nuevo capítulo más centrado en la Web actual, pero mientras robo tiempo del algún sitio para ello, creo que puede ser un buen momento para liberarlo.


También puedes acceder (cuando esté acabada) a la versión en HTML que estoy construyendo con Drupal.