Le navigateur AI reconstruit l'entrée de l'internet, la troisième guerre des navigateurs commence.

Navigateur AI : le nouveau champ de bataille pour reconstruire l'entrée d'Internet

La troisième guerre des navigateurs est en train de se déployer discrètement. En regardant l'histoire, depuis Netscape et IE de Microsoft dans les années 90, jusqu'à l'esprit open source de Firefox et Chrome de Google, la bataille des navigateurs a toujours été une manifestation concentrée du contrôle de la plateforme et des changements de paradigme technologique. Chrome a conquis la position de leader grâce à sa vitesse de mise à jour et son écosystème interconnecté, tandis que Google a formé un circuit fermé d'entrée d'information à travers sa structure de "duopole" entre la recherche et le navigateur.

Cependant, aujourd'hui, ce schéma est en train de vaciller. L'émergence des grands modèles de langage (LLM) a conduit de plus en plus d'utilisateurs à accomplir des tâches sur la page de résultats de recherche sans cliquer, ce qui réduit les comportements de clic sur les pages web traditionnelles. Parallèlement, les rumeurs selon lesquelles Apple envisage de remplacer le moteur de recherche par défaut dans Safari menacent encore plus les bases des profits d'Alphabet, et le marché commence à montrer des signes d'inquiétude vis-à-vis de la "tradition de recherche".

Le navigateur lui-même est également confronté à une redéfinition de son rôle. Il n'est pas seulement un outil pour afficher des pages web, mais aussi un conteneur d'une multitude de capacités telles que l'entrée de données, le comportement des utilisateurs, et l'identité privée. Bien que l'agent IA soit puissant, pour réaliser des interactions complexes sur les pages, appeler des données d'identité locales et contrôler des éléments de la page web, il doit encore s'appuyer sur les frontières de confiance et le bac à sable fonctionnel du navigateur. Le navigateur est en train de passer d'une interface humaine à une plateforme d'appels système pour les agents.

La clé des navigateurs futurs réside dans la conception pour les agents IA - non seulement capables de lire, mais aussi d'écrire et d'exécuter. Des projets comme Browser Use tentent de sémantiser la structure des pages, transformant l'interface visuelle en texte structuré pouvant être appelé par des LLM, réalisant une correspondance entre les pages et les instructions, réduisant considérablement le coût d'interaction.

Les projets majeurs sur le marché commencent à explorer : Perplexity construit un navigateur natif Comet, remplaçant les résultats de recherche traditionnels par de l'IA ; Brave combine protection de la vie privée et raisonnement local, en renforçant les fonctionnalités de recherche et de blocage avec LLM ; tandis que des projets natifs de Crypto comme Donut visent à créer une nouvelle entrée pour l'interaction entre l'IA et les actifs en chaîne. Ces projets ont en commun d'essayer de reconstruire le côté d'entrée du navigateur, plutôt que d'embellir sa couche de sortie.

Pour les entrepreneurs, les opportunités se cachent dans la relation triangulaire entre l'entrée, la structure et l'agence. Le navigateur, en tant qu'interface d'appel du monde pour les futurs agents, signifie que ceux qui peuvent fournir des "blocs de capacité" structurés, appelables et fiables, peuvent devenir une partie intégrante de la nouvelle génération de plateformes. De SEO à AEO(Agent Engine Optimization), du trafic de page à l'appel de chaînes de tâches, la forme des produits et la pensée de conception sont en cours de reconstruction. La troisième guerre des navigateurs se déroule dans "l'entrée" plutôt que dans "l'affichage"; ce qui détermine le vainqueur n'est plus qui attire l'attention des utilisateurs, mais qui gagne la confiance de l'agent et obtient l'accès à l'appel.

Histoire du développement des navigateurs

Au début des années 90, lorsque l'Internet n'était pas encore une partie intégrante de la vie quotidienne, Netscape Navigator est apparu, tel un voilier ouvrant de nouveaux horizons, permettant à des millions d'utilisateurs d'accéder au monde numérique. Ce navigateur n'était pas le premier, mais c'était le premier véritable produit à s'adresser au grand public et à façonner l'expérience Internet. À cette époque, les gens pouvaient enfin naviguer sur le web si facilement grâce à une interface graphique, comme si le monde entier devenait soudainement à portée de main.

Cependant, la splendeur est souvent éphémère. Microsoft a rapidement réalisé l'importance des navigateurs et a décidé de forcer le rapprochement d'Internet Explorer avec le système d'exploitation Windows, en faisant de celui-ci le navigateur par défaut. Cette stratégie est qualifiée de "coup de maître de la plateforme", qui a directement démantelé la position dominante de Netscape sur le marché. De nombreux utilisateurs n'ont pas choisi IE de leur plein gré, mais l'ont accepté par défaut, car c'était le choix du système. Grâce à la capacité de distribution de Windows, IE est rapidement devenu le leader du secteur, tandis que Netscape est tombé dans un déclin inévitable.

Face à la crise, les ingénieurs de Netscape ont choisi une voie radicale et idéaliste - ils ont rendu le code source du navigateur public, lançant un appel à la communauté open source. Cette décision, telle une "cession macédonienne" dans le monde de la technologie, annonçait la fin d'une époque et l'émergence de nouvelles forces. Ce code est devenu la base du projet de navigateur Mozilla, initialement nommé Phoenix( signifiant renaissance du phénix), mais qui a été renommé plusieurs fois en raison de problèmes de marque, pour finalement s'appeler Firefox.

Firefox n'est pas une simple copie de Netscape, il a réalisé de nombreuses percées en termes d'expérience utilisateur, d'écosystème de plugins, de sécurité, etc. Sa naissance marque la victoire de l'esprit open source et insuffle une nouvelle vitalité à l'ensemble de l'industrie. Certains décrivent Firefox comme le "héritier spirituel" de Netscape, tout comme l'Empire ottoman a hérité des derniers feux de Byzance. Bien que cette métaphore soit exagérée, elle a une signification profonde.

Cependant, quelques années avant la sortie officielle de Firefox, Microsoft avait déjà lancé six versions d'IE. Grâce à son avantage temporel et à sa stratégie de bundling système, Firefox s'est retrouvé dès le départ en position de rattrapage, ce qui a rendu cette compétition inégale dès le départ.

Dans le même temps, un autre acteur précoce fait son apparition discrètement. En 1994, le navigateur Opera est lancé, provenant de Norvège, et n'était au départ qu'un projet expérimental. Mais à partir de la version 7.0 en 2003, il a introduit le moteur Presto développé en interne, étant le premier à prendre en charge des technologies de pointe telles que CSS, la mise en page adaptative, le contrôle vocal et l'encodage Unicode. Bien que le nombre d'utilisateurs soit limité, il est toujours à la pointe de la technologie dans le secteur, devenant "le préféré des geeks".

La même année, Apple a lancé le navigateur Safari. C'était un tournant chargé de signification. À l'époque, Microsoft avait investi 150 millions de dollars dans Apple, qui était au bord de la faillite, afin de préserver l'apparence de la concurrence et d'éviter un examen antitrust. Bien que le moteur de recherche par défaut de Safari depuis sa création soit Google, cette histoire de liens avec Microsoft symbolise la relation complexe et subtile entre les géants de l'internet : coopération et concurrence, toujours intimement liées.

En 2007, IE7 a été lancé avec Windows Vista, mais les retours du marché étaient moyens. En revanche, Firefox, grâce à un rythme de mise à jour plus rapide, un mécanisme d'extension plus convivial et un attrait naturel pour les développeurs, a vu sa part de marché augmenter régulièrement pour atteindre environ 20 %. La domination d'IE s'affaiblit progressivement, et le vent commence à tourner.

Google a une approche différente. Bien qu'ils aient commencé à développer leur propre navigateur en 2001, il leur a fallu six ans pour convaincre le PDG Eric Schmidt d'approuver le projet. Chrome a été lancé en 2008, basé sur le projet open source Chromium et le moteur WebKit utilisé par Safari. Il a été qualifié de "navigateur encombrant", mais grâce à l'expertise de Google en matière de publicité et de création de marque, il a rapidement émergé.

L'arme clé de Chrome n'est pas ses fonctionnalités, mais la fréquence de ses mises à jour, ( toutes les six semaines ) avec une expérience unifiée sur toutes les plateformes. En novembre 2011, Chrome a pour la première fois dépassé Firefox, atteignant une part de marché de 27 % ; six mois plus tard, il a de nouveau dépassé IE, réalisant la transformation de challenger à dominateur.

En parallèle, l'internet mobile en Chine est en train de former son propre écosystème. Le navigateur UC d'Alibaba a rapidement gagné en popularité au début des années 2010, en particulier sur les marchés émergents comme l'Inde, l'Indonésie et la Chine, grâce à son design léger et à ses caractéristiques de compression des données pour économiser la bande passante, attirant ainsi les utilisateurs d'appareils bas de gamme. En 2015, sa part de marché mondial des navigateurs mobiles a dépassé 17 %, atteignant même 46 % en Inde à un moment donné. Mais cette victoire n'a pas duré. Avec le renforcement par le gouvernement indien des contrôles de sécurité sur les applications chinoises, le navigateur UC a été contraint de quitter un marché clé, perdant progressivement son ancienne gloire.

Entré dans les années 2020, la position dominante de Chrome est déjà établie, avec une part de marché mondiale stable d'environ 65 %. Il convient de noter que, bien que le moteur de recherche Google et le navigateur Chrome appartiennent tous deux à Alphabet, ils représentent sur le plan du marché deux systèmes hégémoniques indépendants - le premier contrôlant environ 90 % des points d'entrée de recherche dans le monde, tandis que le second détient la majorité des "premières fenêtres" par lesquelles les utilisateurs accèdent à Internet.

Pour maintenir cette structure de double monopole, Google n'hésite pas à investir des sommes considérables. En 2022, Alphabet a versé environ 20 milliards de dollars à Apple, uniquement pour que Google conserve son statut de moteur de recherche par défaut dans Safari. Selon certaines analyses, cette dépense représente 36 % des revenus publicitaires de recherche que Google tire du trafic de Safari. En d'autres termes, Google paie une "taxe de protection" pour son fossé défensif.

Mais le vent a encore une fois changé. Avec l'émergence des modèles de langage de grande taille (LLM), la recherche traditionnelle commence à être perturbée. En 2024, la part de marché de Google dans la recherche est tombée de 93 % à 89 %. Bien qu'il reste dominant, des fissures commencent à apparaître. Plus perturbante encore, il y a des rumeurs selon lesquelles Apple pourrait lancer son propre moteur de recherche AI - si Safari change de moteur de recherche par défaut pour soutenir son propre écosystème, cela ne changera pas seulement le paysage écologique, mais pourrait également ébranler le pilier des profits d'Alphabet. La réaction du marché a été rapide, le prix de l'action d'Alphabet a chuté de 170 dollars à 140 dollars, reflétant non seulement la panique des investisseurs, mais aussi une profonde inquiétude quant à l'avenir de l'ère de la recherche.

De Navigator à Chrome, de l'idéal open source à la commercialisation de la publicité, du navigateur léger à l'assistant de recherche AI, la bataille des navigateurs a toujours été une guerre sur la technologie, la plateforme, le contenu et le contrôle. Le champ de bataille se déplace constamment, mais l'essence n'a jamais changé : celui qui contrôle l'entrée définit l'avenir.

Dans l'esprit des VC, en s'appuyant sur les nouvelles demandes des utilisateurs envers les moteurs de recherche à l'ère des LLM et de l'IA, la troisième guerre des navigateurs est en train de se dérouler progressivement. Voici quelques informations sur le financement de certains projets notables dans le domaine des navigateurs AI.

L'architecture obsolète des navigateurs modernes

En ce qui concerne l'architecture des navigateurs, l'architecture traditionnelle classique est illustrée ci-dessous :

Client - Point d'entrée frontal

Interroger le Google Front End le plus proche livré par HTTPS, effectuer le déchiffrement TLS, l'échantillonnage QoS et le routage géographique. Si un trafic anormal est détecté, ( DDoS, l'automatisation de la capture ) peut être limitée ou contestée à ce niveau.

Compréhension de la requête

L'interface utilisateur doit comprendre la signification des mots saisis par l'utilisateur, en trois étapes : correction orthographique neuronale, corrigeant "recpie" en "recipe" ; expansion des synonymes, élargissant "how to fix bike" à "repair bicycle". Analyse de l'intention, déterminant si la requête est d'information, de navigation ou d'intention transactionnelle, et attribuant la demande Vertical.

Rappel des candidats

La technologie de requête utilisée par Google est appelée : index inversé. Dans un index direct, nous sommes tous capables d'indexer un fichier à partir d'un ID donné. Cependant, les utilisateurs ne peuvent pas connaître le numéro du contenu qu'ils recherchent parmi des milliers de milliards de fichiers. C'est pourquoi Google a adopté un index inversé très traditionnel, qui permet de rechercher quels fichiers contiennent les mots-clés correspondants. Ensuite, Google a utilisé un index vectoriel pour traiter la recherche sémantique, c'est-à-dire pour trouver un contenu ayant un sens similaire à celui de la requête. Il transforme des contenus tels que du texte, des images, etc., en vecteurs de haute dimension (embedding), et effectue des recherches en fonction de la similarité entre ces vecteurs. Par exemple, même si un utilisateur recherche "comment faire une pâte à pizza", le moteur de recherche peut renvoyer des résultats liés à "guide de fabrication de pâte à pizza", car ils sont sémantiquement similaires. Après être passés par l'index inversé et l'index vectoriel, environ cent mille pages web seront pré-sélectionnées.

Tri par niveaux

Le système filtre généralement des pages candidates d'une échelle de centaines de milliers à environ 1000 en utilisant des milliers de caractéristiques légères, telles que BM25, TF-IDF, et le score de qualité de la page, pour constituer un ensemble de candidats préliminaires. Ces systèmes sont communément appelés moteurs de recommandation. Ils dépendent d'une multitude de caractéristiques générées par des entités massives, y compris le comportement des utilisateurs, les attributs des pages, l'intention de recherche et les signaux contextuels. Par exemple, Google prend en compte l'historique de l'utilisateur, les retours d'autres utilisateurs, la sémantique des pages, la signification des requêtes, tout en tenant également compte des éléments contextuels tels que le temps (, les périodes de la journée, les jours spécifiques de la semaine ) et les événements externes tels que les actualités en temps réel.

Apprentissage profond pour le tri principal

Au stade de la recherche préliminaire, Google utilise des technologies telles que RankBrain et Neural Matching pour comprendre le sens des requêtes et filtrer les résultats préliminaires parmi un grand nombre de documents. RankBrain est un système d'apprentissage automatique introduit par Google en 2015, visant à mieux comprendre la signification des requêtes des utilisateurs, en particulier celles qui apparaissent pour la première fois. Il fonctionne en convertissant les requêtes et les documents en représentations vectorielles, puis en calculant la similarité entre eux afin de trouver les résultats les plus pertinents. Par exemple, pour la requête "comment faire une pâte à pizza", même si le document ne contient pas de mots-clés correspondants exacts, RankBrain peut identifier des contenus liés à "base de pizza" ou "préparation de pâte".

Le Matching Neural est une autre technologie lancée par Google en 2018, visant à comprendre plus en profondeur les relations sémantiques entre les requêtes et les documents. Il utilise des modèles de réseaux neuronaux pour capturer les relations floues entre les mots, aidant Google à mieux faire correspondre les requêtes et le contenu des pages web. Par exemple, pour la requête "Pourquoi le ventilateur de mon ordinateur portable fait-il beaucoup de bruit", le Matching Neural peut comprendre que l'utilisateur cherche peut-être des informations de dépannage concernant la surchauffe, l'accumulation de poussière ou une utilisation élevée du CPU, même si ces mots ne figurent pas directement dans la requête.

Réorganisation profonde : Application du modèle BERT

Après une première sélection de

AGENT2.63%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 9
  • Partager
Commentaire
0/400
MoonlightGamervip
· 07-10 09:24
Chrome ne peut pas supporter ça
Voir l'originalRépondre0
AirdropHunterXMvip
· 07-10 07:24
Cherchez un fil, l'IA est arrivée
Voir l'originalRépondre0
ApeWithNoChainvip
· 07-10 02:02
Le navigateur ne peut pas s'empêcher de se relancer.
Voir l'originalRépondre0
0xSoullessvip
· 07-07 10:13
Ah, encore une vague de pigeons à prendre les gens pour des idiots.
Voir l'originalRépondre0
DaoTherapyvip
· 07-07 10:12
Ne fais pas ça, tout est déjà compris par Google.
Voir l'originalRépondre0
CryptoCross-TalkClubvip
· 07-07 10:10
Alertez-moi avec le symbole dollar devant, pigeons de l'univers de la cryptomonnaie depuis trois ans, chaque soir à 20 heures, je commence à raconter des histoires.
Voir l'originalRépondre0
HypotheticalLiquidatorvip
· 07-07 10:09
Un autre effondrement systémique est sur le point de se produire.
Voir l'originalRépondre0
GweiTooHighvip
· 07-07 09:48
Un jour, même Google peut tomber.
Voir l'originalRépondre0
ser_ngmivip
· 07-07 09:47
C'est à la fois de l'IA et de la guerre, c'est une farce.
Voir l'originalRépondre0
Afficher plus
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)