martes, 30 de junio de 2015

Curacion de contenidos

¿Qué es la curación de contenidos?

Juan Arellano publicó en un artículo –“Definiendo la curación de contenidos”– en el que analizaba esta nueva disciplina y ofrecía la siguiente definición:

“La curación de contenido se entiende como la capacidad por parte de un sistema o del ser humano de encontrar, organizar, filtrar y dotar de valor, relevancia, significatividad, en definitiva, de utilidad el contenido de un tema específico que procede de diversas fuentes (medios digitales, herramientas de comunicación, redes sociales…)”.

Desde un punto de vista práctico, podríamos decir que la curación es un proceso de selección de contenidos vinculados a un tema en particular. Mientras la agregación tradicional sólo se cuidaba de reunir contenidos relativos a un tema determinado, la curación filtra esos contenidos y selecciona de entre ellos sólo los mejores o de mayor relevancia.

Así, el “curador de contenidos” se convierte en un especialista en contenidos. En una pirámide, la curación se mostraría como la etapa final de participación en la Red, justo después de la producción, en una evolución de esa participación compuesta de cinco etapas:
  • consultar, compartir, comentar, producir, curar.
Según esa pirámide, los usuarios comenzamos simplemente consultando los contenidos que se nos ofrecían en la Red para después pasar a compartirlos con otros usuarios, más tarde añadir nuestros comentarios y finalmente producir nuestros propios contenidos. El nuevo paso, culminación de ese proceso, sería la curación, el filtrado y selección eficientes de los contenidos.

Existen cinco modelos de curación de contenidos:
  1. la agregación, el acto de reunir la información más relevante sobre un tema específico en un mismo lugar.
  2. la destilación, una forma de realizar la curación de contenidos en un formato más simple, donde solo son compartidas las ideas más relevantes.
  3. la elevación, con la misión de identificar tendencias en pequeñas porciones de información compartidas online, como por ejemplo lo tweets en Twitter.
  4. el mashup, como la unión de contenidos curados para crear un nuevo punto de vista.
  5. la cronología, atendiendo a la reunión de información histórica organizada sobre la base del paso del tiempo para la evolución en la percepción de un determinado tema.

De estos diferentes modelos de curación, no es que uno sea mejor que otro, sino que permiten a las organizaciones posicionarse de diferentes maneras en la mente de los usuarios.

Hay algunas funciones, que se han ido incorporando a lo largo de la evolución de la Web 2.0 (Blogs, Facebook, Twitter, Tumblr, Delicious, Foursquare, Read it later, etc.), que son esenciales para la curación de contenidos. Estas son las siguientes:

  1. Divulgar lo que otros publican. Con Facebook, pero sobretodo con Twitter y Tumblr, se puso de manifiesto la importancia de “re-transmitir” la información con retweets y re-blogs respectivamente).
  2. Guardar lo que otros publican para leerlo y procesarlo más tarde. Esto es lo que puedes hacer con Delicious.
  3. Y, finalmente, estructurar la información en conjuntos. Hasta ahora teníamos dos mecanismos para organizar la información: la timeline y las etiquetas (hashtags). Pero también se puede clasificar lo que se publica en conjuntos que se pueden compartir y en los que otros usuarios pueden contribuir, a su vez, incluyendo sus propias publicaciones.

El futuro de la Web Social se verá impulsado por estos curadores de contenido, content curators o “intermediarios críticos del conocimiento”, que se encargan de recoger y compartir los mejores contenidos en línea publicando compilaciones de gran valor creados por otras personas.


Actividad Final de Evaluación P2P: Curadores de contenido. Tablero creado en Scoop.it sobre la
exitosa serie de la HBO Juego de Tronos (Game of thrones), que espero tengo muchos seguidores: 

miércoles, 24 de junio de 2015

Buscando la opinión del crítico Carlos A. Scolari sobre la serie de ficción Breaking Bad

¿Qué piensa Carlos A. Scolari, profesor del curso de Miríada X 'La 3ª edad de oro de la televisión', sobre el fenómeno de la serie Breaking Bad (desde el punto de vista académico?, con esta pregunta comenzamos el ejercicio de el arte de preguntar.  

Transformando la pregunta para el buscador de Google Académico, nos quedaría algo así:


Tras la búsqueda nos darían los siguientes resultados:


Y dentro de los mismos, los dos PDFs que les muestro a continuación, que resolvería la pregunta principal que nos planteamos, ya que en dichos textos encontramos lo que buscabamos:


He querido hacerlo de forma visual, para que se vieran los pasos dados desde la pregunta hasta encontrar la respuesta.  He realizado algunas búsquedas alternativas, excluyendo palabras (nombre de otras series) e incluso precisando la fuente del artículo (Universidad Pompeu Fabra), pero los resultados no eran del todo satisfactorio, por lo que decidí ajustar la búsqueda tal cual indico. 

martes, 16 de junio de 2015

Web Superficial y Web Profunda

Para buscar bien, es imprescindible tener en cuenta, que además de los buscadores convencionales, hay disponibles otras fuentes específicas de información. 

Los buscadores tradicionales sólo ofrecen acceso a una pequeña parte de lo que existe online, lo que se ha comenzado a llamar la Web superficial o visible. Lo que resta, la Web profunda o invisible, es un amplio banco de información ubicado en catálogos, revistas digitales, blogs, entradas a diccionarios y contenido de sitios que demandan un login (aunque sea gratuito) y otros tipos de contenido que no aparecen entre los resultados de una búsqueda convencional. 

La Web Superficial o visible 

La Web Superficial comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda. 

Las características principales de los sitios de la Web visible son: 
  • su información no está contenida en bases de datos 
  • es de libre acceso 
  • no se requiere la realización de un proceso de registro para acceder a la información. 
  • mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace.

La Web Profunda o invisible 


Web invisible es el término utilizado para describir toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos. 

Parte de la información es "invisible" a los robots de los buscadores convencionales, ya que los resultados se generan en la contestación a una pregunta directa mediante páginas dinámicas (ASP, PHP, etc.) es decir páginas que no tienen una URL fija y que se construyen en el mismo instante (temporales) desapareciendo una vez cerrada la consulta. 

Sherman y Price identifican cuatro tipos de contenidos invisibles en la Web: 
  • la Web opaca (the opaque Web), 
  • la Web privada (the private Web), 
  • la Web propietaria (the proprietary Web) y 
  • la Web realmente invisible (the truly invisible Web).

- La Web opaca está compuesta por archivos que, si bien podrían estar incluidos en los índices de los buscadores, no lo están por alguno de los siguientes motivos: 
  • Extensión de la indización: a veces, por economía, no todas las páginas de un sitio son indizadas en los buscadores. 
  • Frecuencia de la indización: los buscadores no poseen la capacidad de indizar todas las páginas existentes; a diario se agregan y modifican muchas y la indización no se realiza al ritmo que permita incluirlas a todas. 
  • Número máximo de resultados visibles: aunque los motores de búsqueda arrojan a veces un gran número de resultados, generalmente limitan el número de documentos que se muestran (entre 200 y 1000). 
  • URL desconectadas: las generaciones más recientes de buscadores, presentan los documentos por relevancia basada en el número de veces que aparecen referenciados en otros. Si un documento no tiene un link a él, desde otro documento, será imposible que la página sea encontrada, pues no se encuentra indizada. 
- La Web privada consiste en las páginas Web que podrían estar indizadas en los buscadores pero son excluidas deliberadamente por alguno de estos motivos:
  • Las páginas están protegidas por contraseñas. 
  • Contienen un archivo “robots.txt” para evitar ser indizadas. 
  • Contienen un campo “noindex” para evitar que el buscador pueda indizar la parte correspondiente al cuerpo de la página. 
Este segmento de la Web contiene, en general, documentos excluidos deliberadamente por su falta de utilidad. Ya que son los dueños de la información que contienen, los que deciden que no se encuentre disponible, por lo que difícilmente se podrán encontrar mecanismos legítimos para franquear esa barrera.

- La Web propietaria incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o arancelada. 

- La Web realmente invisible se compone de páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica.

Veamos algunos de los recursos de búsqueda en la Web Profunda: 
  • The WWW Virtual Library se considera el catálogo más antiguo en la web y fue iniciado por Tim Berners-Lee, el creador de la web. 
  • Infoplease es una Web de consulta con más de 57.000 artículos de la prestigiosa enciclopedia Columbia. Facilita la consulta de información con opciones de búsqueda por términos o por áreas de conocimiento. Es posible acceder a un buen número de enciclopedias, atlas, y biografías. Y también tiene algunas ramificaciones interesantes como Factmonster.com para los niños y Biosearch, un motor de búsqueda sólo para biografías, o información de todo lo acontecido históricamente en un determinado día. 
  • DeepWebTech ofrece cinco motores de búsqueda para temas específicos. Los motores de búsqueda abarcan la ciencia, medicina y negocios. El uso de estos motores de búsqueda específicos del tema, puede consultar las bases de datos subyacentes en la Web profunda. 
  • TechXtra centra su información, en ingeniería, matemáticas e informática. Es posible navegar a través de una extensa lista de revistas gratuitas especializadas de ingeniería, documentos técnicos, descargas y podcasts. 
Según Lluis Codina: “Internet invisible es un nombre claramente inadecuado para referirse al sector de sitios y de páginas web que no pueden indizar los motores de búsqueda de uso público. Debería denominarse, en realidad, la web "no indizable", lo cual es un término mucho más adecuado”.


miércoles, 10 de junio de 2015

La búsqueda avanzada

Presentación sobre la búsqueda avanzada: 



La búsqueda avanzada es un tipo de búsqueda que posee características adicionales soportadas por un motor de búsqueda o buscador. Suele ser una opción de elección libre en los buscadores, programas, herramientas y servicios online. 

Una búsqueda simple generalmente consta de un cuadro de texto en el que se ingresa una cadena de caracteres, en cambio, las búsquedas avanzadas suelen contar con múltiples cuadros de texto, casillas de verificación y otros elementos incluidos habitualmente en los formularios. Por lo general, estos elementos permiten aplicar filtros a la búsqueda básica, para obtener resultados más exactos.

La Búsqueda avanzada de Google, ofrece numerosas opciones para realizar búsquedas con mayor precisión y obtener resultados más útiles.

La Búsqueda avanzada de Google, ofrece numerosas opciones para realizar búsquedas con mayor precisión y obtener resultados más útiles. Podemos acceder a ella a través de su URL .

Además de la introducción de términos en el campo de búsqueda, Google ofrece otras opciones, que nos permiten encontrar páginas que contenga:
  • Todas las palabras que se mencionan
  • Una frase exacta
  • Cualquiera de una serie de palabras
  • Ninguna de las palabras que se mencionan
  • Valores comprendidos en un determinado intervalo

Veamos un ejemplo: Si realizamos una búsqueda referida a la búsqueda de una cámara digital para su compra, la queremos con batería recargable, que sea réflex o HD, que no sea color rojo y que tenga una resolución entre 16 y 24 megapíxeles.

Para realizar la misma búsqueda de la forma habitual, es decir mediante el cuadro de búsqueda y por palabras claves, deberíamos escribir:cámara digital reflex OR HD "batería recargable" -rojo 16mp..24mp

Además, podemos restringir los resultados por: idioma, región, fecha de la actualización del artículo, podemos ingresar la URL de un sitio específico, dónde deben aparecer los términos que ingresamos (en el título, descripción o en cualquier parte de la página), los resultados más relevantes, el tipo de archivo (esto es muy útil ya que por ejemplo podemos seleccionar, documentos de texto, PDF, presentaciones multimedia, planillas de cálculo, entre otros) y finalmente por los derechos de uso del material.

La búsqueda avanzada de imágenes

Una de las opciones de las que dispone Google es la búsqueda de imágenes, tan solo tenemos que hacer clic sobre el vínculo Imágenes, automáticamente Google cambia la interfaz, escribiremos en el cuadro de búsqueda la palabra clave asociada a la imagen y pulsaremos sobre “Buscar imágenes”.

La búsqueda de imágenes de Google permite además de agregar términos en el cuadro de búsqueda, buscar por imagen es decir ingresar la URL de una imagen o subir un archivo de imagen desde nuestra computadora, eso nos permitirá encontrar la imagen u otras similares como puede verse en el ejemplo.

La Búsqueda avanzada de imágenes de Google, también nos ofrece numerosas opciones para filtrar información y realizar búsquedas con mayor precisión: entre otras posibilidades seleccionar el tamaño, proporción, color, tipo de imagen, tipo de archivo entre otras posibilidades.

Y tú, ¿cómo realizas tus búsquedas?

Sin duda a partir de ahora ya sabes cómo encontrar lo que buscas, en el menor tiempo posible y con resultados satisfactorios, ¿lo probamos?

miércoles, 3 de junio de 2015

Actividad de evaluación P2P: Herramientas (clasificación)


Las mejores herramientas

Existen diferentes tipos de herramientas de búsqueda de información en Internet. Cada una de ellas funciona de una manera diferente y tiene su propio propósito y su alcance. Aquí nos referiremos a: buscadores, metabuscadores, directorios, guías y software especializado.

Buscadores

Los buscadores o motores de búsqueda utilizan tipos de software especiales que localizan e indexan, en forma automática, las páginas Web y además todos los documentos referenciados en ellas.

Un buscador está compuesto por cuatro componentes básicos:   
  • un robot,
  • un motor de indexación,
  • los índices
  • un motor de búsqueda.

El robot, también llamado spider, es un programa que se encarga de recorrer la Web obteniendo información relevante, de cada una de las páginas que visita.

Una vez obtenida la información de la página, debe ser analizada y condensada, para su organización y su posterior presentación a los usuarios. Esta tarea la realiza el denominado motor de indexación.

La indexación puede efectuarse por palabras claves, que es la forma más común, o por conceptos. En el caso de hacerlo por palabras claves, algunos buscadores indexan todo el texto del documento, a excepción de los artículos, preposiciones y otros términos denominados “palabras vacías”.

Otros motores de búsqueda se limitan a incluir en la indexación a las palabras que más se repiten, o priorizan los términos que se encuentran en el título, la URL, las cabeceras, los enlaces, los primeros párrafos y además, las palabras claves incluidas en las etiquetas o tags.

Para facilitar la búsqueda, en la información recolectada, se utilizan estructuras de datos denominadas "índices o ficheros inversos", mediante los cuales se asocia una palabra a una lista de documentos relacionados con ella.

El motor de búsqueda es el encargado de procesar las consultas recibidas por los usuarios, para lo cual recorre los índices inversos buscando los términos relacionados con la consulta y obteniendo los identificadores de los documentos. Finalmente los ordena jerárquicamente y presenta al usuario los resultados obtenidos.
Este tipo de herramienta, realiza sus búsquedas en sus propios índices, no lo hace directamente sobre la Web. Esto implica, que los buscadores, solo pueden recuperar una muy pequeña parte de todo lo que realmente hay en Internet. Es importante señalar que los motores de búsqueda se diferencian entre sí por diferentes características como: el volumen y la frecuencia de indexación y el ordenamiento que hacen de la información encontrada para su presentación.
Entre los buscadores más importantes se encuentran:
  • Google: el más utilizado.  
  • Lycos: un portal web que incluye un buscador que surgió como un proyecto de desarrollo de un motor de búsqueda.
  • Bing: anteriormente Live Search, Windows Live Search y MSN Search, es un buscador Web de Microsoft.


Metabuscadores

Los metabuscadores son “buscadores en buscadores”, es decir, son servidores web que realizan búsquedas en los índices de un gran número de buscadores y/o directorios, eliminan las duplicaciones y nos presentan un resumen de los resultados obtenidos, ordenados por relevancia y, en algunos casos, nos indican cuál ha sido el buscador de origen de dicha información. Cada uno de los motores de búsqueda de los metabuscadores funciona de una manera distinta, aunque existe un proceso interno común a todos ellos. Los pasos en el funcionamiento de un metabuscador son los siguientes:
  • El usuario realiza su petición al metabuscador.
  • El metabuscador da formato a dicha petición de acuerdo a la interfaz de cada uno de los buscadores y les pasa la solicitud.
  • Los buscadores realizan la búsqueda utilizando sus medios habituales a partir de los sitios web en Internet.
  • Éstos devuelven la información obtenida al metabuscador, el cual analiza los datos.
  • El metabuscador organiza la información de acuerdo a los criterios del mismo y se la muestra al usuario.

Podría decirse entonces que el metabuscador aporta resultados seleccionados y ordenados mediante puntos de vista distintos y su ventaja principal es que amplía el ámbito de las búsquedas que realizamos.
Tengamos en cuenta que cada buscador utiliza su propia estrategia a la hora de recoger la información y ordenar los resultados de las búsquedas, por lo que las páginas de mayor relevancia en un buscador no tienen por qué coincidir con las del resto.

Entre los metabuscadores más importantes se encuentran:

Directorios

Los directorios, también denominados buscadores temáticos, organizan la información por medio de categorías y sub-categorías que registran las direcciones (URL) y una pequeña descripción de los diferentes sitios que han sido indexados.

Son organizados en forma manual a partir del registro de sitios por parte de sus autores, y de un proceso posterior de selección y categorización jerarquizada por parte de los editores.

Entre los directorios más importantes se encuentran:

Muchos buscadores incluyen además un sistema de navegación en forma de directorio y por otra parte, algunos directorios complementan sus resultados con los de una búsqueda en un buscador. Pero es importante realizar una distinción entre estos dos tipos de herramientas de búsqueda de información, ya que, se organizan y funcionan de diferente manera.

Guías
Las guías temáticas están conformadas por páginas de recursos web organizadas por áreas del dominio de diversos especialistas y entidades académicas que asumen la tarea de elaborarlas.

Por lo general incluyen algún mecanismo de búsqueda en sus páginas o en el sitio en general. Estos directorios anotados suelen ser de gran calidad ya que la selección de recursos, es muy cuidadosa y su actualización, frecuente.

Visualiza la siguiente presentación para ampliar la información: Guías temáticas

En ciertas ocasiones, varias instituciones se asocian para la elaboración cooperativa de estas guías.

Software especializado

Para mejorar las búsquedas en la Web puede utilizarse software especializado. Estos agentes auxiliares se instalan en nuestra PC y operan junto a los navegadores añadiéndoles ciertas funcionalidades, como el manejo de conceptos para la recuperación de la información.

Un ejemplo es “Copernic Agent”, una herramienta realmente útil que permite la búsqueda selectiva en múltiples fuentes y la clasificación mediante potentes herramientas de análisis.

miércoles, 27 de mayo de 2015

Infoxicación o cómo morir ante una sobrecarga de información

La posibilidad de acceder hoy día a una gran cantidad de información es una de las grandes virtudes de Internet, pero a la vez es un problema, ya que tanta información se vuelve incontrolable. ¿Cuántas veces nos hemos perdido ante tal cantidad de datos, páginas o entradas sobre un tema que nos interesaba? Virtudes y defectos de la excesiva información. 

La “sobrecarga informativa” (information overload) es una expresión que acuñó Alvin Toffler en su libro 'Future Shock', 1970, y hace referencia al estado de contar con demasiada información para tomar una decisión o permanecer informado sobre un determinado tema. Ante una gran cantidad de información para analizar, o contradicciones en la información disponible, o no disponemos de un método para comparar y procesar diferentes tipos de información, estamos frente a una 'infoxicación' (información intoxicación), término introducido por Alfons Cornella en 1996, refiere actualmente a la idea de que la sobrecarga de información que recibe un usuario, en especial de Internet en todas sus formas, puede causarle la sensación de no poder abarcarla ni gestionarla y, por tanto, llegar a generarle una gran angustia. 

José Ignacio Aguaded Gómez, en su artículo 'Desde la infoxicación al derecho a la comunicación'   expresa: "Asistimos, sin duda, a una hiperconexión compulsiva y una sobreinformación global, a una obsesión por la comunicación perpetua vacía de contenidos… La infoxicación, la infopolución… se ha hecho realidad en nuestras vidas".

A Humberto Eco le preguntaron lo siguiente: "A pesar de la evolución, ¿ve Internet como un peligro para el conocimiento?" y parte de su respuesta fue: "Internet es todavía un mundo salvaje y peligroso. Todo llega allí sin jerarquía. La inmensa cantidad de cosas que circula es peor que la falta de información. El exceso de información provoca amnesia. El exceso de información es malo".

Los problemas derivados de la sobreinformación pueden afectar nuestro rendimiento personal y profesional. Si prestamos demasiada atención a una gran cantidad de información de manera sostenida en el tiempo y no finalizamos una tarea para continuar con otra diferente, esto dificulta la desconexión de la mente, y la obliga a realizar un sobreesfuerzo. Es por esto que, debemos reflexionar acerca de cómo nos informamos y qué métodos y herramientas utilizamos para gestionar la información.

El profesor de la Universidad de Nueva York Clay Shirky aseguró en la Web 2.0 Expo de 2010 que “El problema no es la sobrecarga de información, es que el filtro no funciona”. 



En este universo de exceso de información tendríamos que tener muy claro cuál es nuestra información crítica, es decir, aquello de lo que no podemos no estar informado y luego saber buscar, es decir, aprender a formular las preguntas correctas y conocer cuáles son las fuentes adecuadas, dónde debemos buscar. La forma de conseguir una mejora en la productividad personal pasa por recibir la información adecuada. Para ello deberíamos saber, cada uno de nosotros, cuáles son los cinco temas fundamentales en los que trabajamos o estudiamos, los cinco temas secundarios y cuál es la lista de información crítica para cada uno de estos temas. 

Según Cornella, un objetivo final de todo esto sería tener un filtro personal de información; que la información a la que accedemos cada día pudiéramos dividirla literalmente en tres grandes partes: información fatal, que es aquella información que no nos interesa en absoluto porque no tiene nada que ver con los temas que tratamos; información interesante, que es aquella que, en algún momento puede interesarnos y aquella información que nos es realmente útil.

Debemos tener claro acerca de cuáles temas debemos estar informados, saber dónde buscamos la información y cómo hacerlo.


Para saber más:
  •  'Como sobrevivir a la infoxicación' - Alfons Cornella. Trascripción de la conferencia del acto de entrega de títulos de los programas de Formación de Posgrado del año académico 1999-2000.