|
Dictionnaire |
|
Agent
Agent
Programme informatique effectuant une tâche répétitive
à la place d'un humain. En ce qui concerne
la recherche d'information, il existe des agents
indexeurs du web (spiders)
ou encore d'autres qui interrogent plusieurs moteurs
simultanément (méta-moteurs).
On ne peut dans ce domaine pas encore parler d'intelligen
ce artificielle car cela impliquerait des agents disposant
d'une base de connaissance, pouvant l'enrichir
par eux-même et surtout pouvant s'adapter
au réseau en communiquant avec des pairs. L'avenir
est sûrement dans la mise en place de systèmes
multi-agents coopératifs.
Algorithme de Pertinence
Relevancy Algorythm
Méthode qu'utilise un moteur
ou un annuaire pour relier les
mots-clés d'une requête
avec le contenu de chaque page, de telle sorte que les
pages Web trouvées correspondent bien au sujet
de la requête. Les algorithmes deviennent de plus
en plus performants et se rapprochent du raisonnement
humain abusant de l'ellipse, de l'analogie
ou de la contextualisation .
Annuaire
Directory
Un serveur ou un groupe de serveurs dédiés
à l'indexation
des pages du web. Ces annuaires retournent une liste
de pages de liens selon les requêtes particulières
faites par le visiteur. Les annuaires sont généralement
mis à jour manuellement, le plus souvent suite
à la demande de l'utilisateur (comme à
Whatsnew.com) et la plupart mettent en place un procédé
éditorial de sélection et/ou de catégorisation
(comme Yahoo et Looksmart). L'apparition d'annuaires
thématique permet de cibler immédiatement
sa recherche.
voir la partie liens pour aller
sur les différents annuaires
Ask Jeeves
Un moteur de recherche
a qui il est possible d'interroger en utilisant
des phrases en anglais et en langue naturel (ex : what
is the meaning of life). Ce service se trouve à
l'adresse
http://www.aj.com.
Bruit et silence
Noise and silence
Pour une requête
spécifique, le bruit serait un trop grand nombre
de résultats, parfois des milliers. Au contraire
le silence représenterait trop peu de réponses
pour une requête donnée. Optimiser sa recherche
d'information consiste à trouver rapidement
des sites pertinents en évitant ces deux écueils.
Contenu dynamique
Dynamic content
À opposer au contenu statique, ce sont des pages
web avec des informations qui changent ou sont changées
automatiquement en fonction d'une base de données
ou d'éléments provenant de l'utilisateur.
(extensions: .asp, .cfm, .cgi ou .shtml.) Ces contenus
sont mal référencés par les moteurs
de recherche car leur spider
ne peut pas entrer dans la base et générer
toutes les pages possibles. Des agents
particuliers (aide à l'achat) sont toutefois
capables d'interagir avec ces bases.
Direct Hit
Un système qui contrôle la sélection
des utilisateurs des moteurs
de recherche au niveau de la page des résultats.
Il"scrute"
en tâche de fond les liens cliqués par
les utilisateurs sur un moteur de recherche et donne
ensuite le "best-of" de ces liens pour un mot clé
donné.
Direct Hit est utilisé par HotBot, Netscape et
comme un plug-in dans le dernier système de recherche
d'Apple, Sherlock.
Voir http://www.directhit.com
|
|
|
|
|
|
|
Anecdote |
|
Northern
Light vient d'annoncer qu'il a modifié son outil
de recherche pour s'approcher le plus possible du fonctionnement
du cerveau humain. Hum, hum... Il tient en tout cas
compte, maintenant, de l'indice de popularité (le
nombre de liens pointant sur un site) d'une page dans ses
résultats. Comme Google, il tiendrait compte également
de la qualité des liens pointant sur le site et non
pas uniquement du nombre de ceux-ci. Encore une manière
de supprimer les pages satellites des premières pages
de résultats ! |
|
|
Pub |
|
|
|
Copies ou reproductions strictement réservées
à l'usage privé ou pédagogique dans un cercle de classe.
|
"Supports de cours sur le réseau"
|
|
|
|