Archie, le premier moteur de recherche d’Internet, fête ses 30 ans. Conçu en 1990 par Alan Emtage, alors étudiant en informatique à l’Université McGill, Archie est considéré comme le grand-père des moteurs de recherche actuels. Plusieurs des techniques développées par son créateur sont toujours utilisées aujourd’hui par Google, Bing ou Yahoo.
La création d’Archie, dérivé du mot « archive », visait à répondre à un besoin de trouver des informations dans des archives accessibles publiquement sur Internet. « Internet, à ce moment-là, était quelque chose de très lent et peu interactif, ce qui rendait les recherches très fastidieuses », explique Mr. Emtage. Il a donc créé un programme qui lui permettrait de dresser une liste des informations disponibles dans les archives, pour faire des recherches plus facilement sur un disque local.
Ce processus s’est déroulé en plusieurs étapes. La première consistait en une phase d’exploration, où les informations disponibles en ligne étaient trouvées. La deuxième était une phase de récupération, au cours de laquelle les informations étaient rassemblées. La dernière était une phase d’indexation au cours de laquelle les informations étaient organisées en index, afin de permettre la recherche.
La technique a attiré l’attention des unités de recherche universitaires, et les requêtes d’informations se sont multipliées. Cependant, comme l’index produit se trouvait sur un disque local, Mr. Emtage a dû fournir manuellement les résultats des recherches. « Avec mon superviseur de recherche, on s’est dit que c’était un peu fou qu’il y ait une intervention humaine dans le processus, se souvient-il. Nous avons alors créé une interface qui permettait à tous de faire des recherches directement dans l’index. » C’est ainsi qu’est né le premier moteur de recherche.
L’apogée et le déclin d’Archie
Au début des années 1990, Archie connaît un franc succès. « À un moment, les gens du centre d’opération du réseau Internet au Canada nous ont contactés pour nous dire que la moitié du trafic Internet de l’est du Canada passait par l’ordinateur, où était installé Archie, à savoir Montréal », détaille Mr. Emtage.
Malgré ce succès, l’évolution d’Internet vers le Web [voir encadré] a rendu Archie moins attrayant. « Même si Archie a créé toutes les techniques utilisées par les premiers moteurs de recherche du Web, ce dernier utilise une infrastructure complètement différente de celle des FTP anonymes pour laquelle Archie a été conçu », résume Mr. Emtage. Il ajoute aussi qu’à l’époque, plusieurs centaines de moteurs de recherche Web existaient, et que lui et ses collègues ont décidé de ne pas transformer Archie pour le Web.
L’héritage d’Archie
La Foire aux questions (FAQ) de Google précise que les phases d’exploration et d’indexation sont encore la base de leur moteur de recherche. Le Web a permis d’exploiter les liens entre les sites pour permettre la découverte d’informations qui n’étaient pas indexées à l’origine. Alors qu’il fallait indiquer manuellement à Archie quelles archives Internet indexer, les moteurs de recherche Web peuvent « découvrir » de nouvelles sources d’information en suivant les hyperliens entre les sites.
« Les moteurs de recherche sont essentiels pour le fonctionnement du monde moderne, avance Mr. Emtage. Et ce que Google a fait, c’est un peu comme de parler avec Dieu, dans une idée séculaire où c’est ce que l’on a de plus proche d’un être omniscient. » Il trouve, malgré tout, qu’il n’y a pas beaucoup d’émoi pour un tel accès à la connaissance, alors que c’est une révolution pour l’humanité.
Mr. Emtage soutient que l’avenir des moteurs de recherche sera intimement lié au développement de l’intelligence artificielle, et que cette dernière jouera un grand rôle dans capacité de la population à trouver des informations en ligne.
L’Université de Varsovie a conservé un serveur sur lequel les internautes peuvent toujours faire l’expérience d’Archie : http://archie.icm.edu.pl/archie-adv_eng.html
ENCADRE : FTP et HTTP :
Développé dans les années 1970, le File Transfert Protocol, ou FTP, est devenu en 1985 une norme internationale de transfert de données entre les ordinateurs et les serveurs. Archie a été créé pour faciliter la recherche des données contenues dans des archives FTP accessibles publiquement (ou anonymes), où étaient conservées une grande part des?informations en ligne à l’époque. Bien que les FTP existent toujours aujourd’hui, les informations sur Internet sont gérées différemment.
En 1989, le scientifique britannique, Sir Timothy John Berners-Lee, avec ses collègues du Conseil européen pour la recherche nucléaire (CERN), a développé un nouveau système de gestion de l’information sur Internet : le World Wide Web. Abrégé WWW et simplement appelé le Web, ce système repose sur un autre protocole de transfert, l’Hypertext Transfer Protocol, ou HTTP. Le Web a rapidement gagné en popularité, entre autres, grâce au développement des navigateurs, et il est devenu le principal système de gestion de l’information sur Internet.