Publicidad:
Terra
La Coctelera

Tenka text

Tenka text es un programa de análisis de cuerpo de texto, en donde muestra la cantidad de palabras que hay en una colección, número de palabras vacías, total de caracteres, total de frases.

Greenstone.

Greenstone es un conjunto de programas de software diseñado para crear y distribuir colecciones digitales, proporcionando así una nueva forma de organizar y publicar la información a través de Internet o en forma de CD-ROM.

El objetivo del software Greenstone es dar el potencial de construir sus propias bibliotecas digitales a los usuarios, especialmente en universidades, bibliotecas y otras instituciones de servicio público. Las bibliotecas digitales están cambiando radicalmente la manera en que se adquiere y disemina la información en las comunidades e instituciones que participan en UNESCO.


[1] Tomado de la página principal de Greenstone, http://www.greenstone.org/index_es

Recuperación de Información

La recuperación de información, llamada en inglés information retrieval (IR), es la ciencia de la búsqueda de información en documentos, búsqueda de los mismos documentos, la búsqueda de metadatos que describan documentos, o, también, la búsqueda en bases de datos, ya sea a través de internet, intranet, para textos, imágenes, sonido o datos de otras características, de manera pertinente y relevante.

Enlace:

Consultado en : http://es.wikipedia.org/wiki/Recuperaci%C3%B3n_de_informaci%C3%B3n

Baeza-Yates, Ricardo; Ribeiro-Neto, Berthier: Modern Information Retrieval. New York : ACM;Harlow, Essex: Addison-Wesley Longman, 1999.Baeza-Yates, Ricardo; Ribeiro-Neto, Berthier: Modern Information Retrieval. New York : ACM;Harlow, Essex: Addison-Wesley Longman, 1999.

Swish-e

Swish-e es un rápido, flexible, y el sistema de código abierto para la indexación de las colecciones de páginas Web u otros archivos. Swish-e es ideal para las colecciones de un millón de documentos o más pequeño. Usando el analizador de GNOME TM libxml2 y una colección de filtros, Swish-e puede índice de texto sin formato, e-mail, PDF, HTML, XML, Microsoft ® Word / PowerPoint / Excel y casi cualquier archivo que se puede convertir a XML o HTML texto. Swish-e es también de uso frecuente para completar bases de datos como el DBMS MySQL ® para muy rápida búsqueda de texto completo.[1]


 

[1] Holon.net Equipo Web, Swish-e fue presentado en el artículo Linux Journal Cómo Índice cualquier cosa por Josh Rabinowitz.

Documento semiestructurado

Son documentos mixtos que contienen parte estructurada y parte no estructurada.

Tomado de:Utilización de Medios Electrónicos, Informáticos y Telemáticos en los Procedemientos de Contratación del Ayuntamiento de Madrid y sus Organismos Autónomos. en:http://test-www.munimadrid.es/portales/munimadrid/es/Inicio/El-Ayuntamiento/Normativa/Listado-de-Normativa/ANM-2006-80-Utilizacion-de-Medios-Electronicos--Informaticos-y-Telematicos-en-los-Procedemientos-de-Contratacion-del-Ayuntamiento-de-Madrid-y-sus-Organismos-Autonomos?vgnextfmt=default&vgnextoid=62f446ec02e4f010VgnVCM1000009b25680aRCRD&vgnextchannel=00dfb351fd18d010VgnVCM1000009b25680aRCRD&chid=00dfb351fd18d010VgnVCM1000009b25680aRCRD&cmid=62f446ec02e4f010VgnVCM1000009b25680aRCRD&oid=62f446ec02e4f010VgnVCM1000009b25680aRCRD&numPagina=3&idSubPage=3

Esto quiere decir que se encuentra la información fácil y puede ser modificada.

Ejemplo: Nombre: Carolina Pérez, Edad:22 años

                 Nombre: Diego Trujillo, Edad:45 años

Documento estructurado

son aquellos que tienen una estructura predefinida que no varía, y los datos que contienen están claramente identificados.

Tomado de: Utilización de Medios Electrónicos, Informáticos y Telemáticos en los Procedemientos de Contratación del Ayuntamiento de Madrid y sus Organismos Autónomos. En:http://test-www.munimadrid.es/portales/munimadrid/es/Inicio/El-Ayuntamiento/Normativa/Listado-de-Normativa/ANM-2006-80-Utilizacion-de-Medios-Electronicos--Informaticos-y-Telematicos-en-los-Procedemientos-de-Contratacion-del-Ayuntamiento-de-Madrid-y-sus-Organismos-Autonomos?vgnextfmt=default&vgnextoid=62f446ec02e4f010VgnVCM1000009b25680aRCRD&vgnextchannel=00dfb351fd18d010VgnVCM1000009b25680aRCRD&chid=00dfb351fd18d010VgnVCM1000009b25680aRCRD&cmid=62f446ec02e4f010VgnVCM1000009b25680aRCRD&oid=62f446ec02e4f010VgnVCM1000009b25680aRCRD&numPagina=3&idSubPage=3

Esto significa que la información se encuentra ordenada adecuadamente y facilita la búsqueda a los usuarios.

 

Ejemplo 

Nombre documento

 

Dependencia responsable

 

Tiempo  de conservación

 

 

Documento no estructurado

Son aquellos que no tienen una estructura claramente establecida.

Tomado de: Utilización de Medios Electrónicos, Informáticos y Telemáticos en los Procedemientos de Contratación del Ayuntamiento de Madrid y sus Organismos Autónomos. En:http://test-www.munimadrid.es/portales/munimadrid/es/Inicio/El-Ayuntamiento/Normativa/Listado-de-Normativa/ANM-2006-80-Utilizacion-de-Medios-Electronicos--Informaticos-y-Telematicos-en-los-Procedemientos-de-Contratacion-del-Ayuntamiento-de-Madrid-y-sus-Organismos-Autonomos?vgnextfmt=default&vgnextoid=62f446ec02e4f010VgnVCM1000009b25680aRCRD&vgnextchannel=00dfb351fd18d010VgnVCM1000009b25680aRCRD&chid=00dfb351fd18d010VgnVCM1000009b25680aRCRD&cmid=62f446ec02e4f010VgnVCM1000009b25680aRCRD&oid=62f446ec02e4f010VgnVCM1000009b25680aRCRD&numPagina=3&idSubPage=3

Se puede decir que en este tipo de estructura no se puede encontar la información pertinente, de acuerdo a las necesidades de cada usuario.

Un ejemplo de esto es un documento en donde no esté clasificada la información que uno necesita.

Documento virtual

Documento que no es un documento real (el que se puede consultar sin ningún cambio, esto es, en su estado presente, actual), pero que contiene los datos específicos necesarios para producirlo.

Tomado de:Guzmán Domínguez, Jesús.EL DOCUMENTO ELECTRÓNICO, DIGITAL Y VIRTUAL. CRITERIOS PARA EVALUAR FUENTES PROVENIENTES DE INTERNET. En:http://educacioninclusiva.host56.com/documentos/MI%2005.pdf

Un ejemplo de esto son los buscadores.