Navegador AI: El nuevo campo de batalla para reconstruir la entrada a Internet
La tercera guerra de los navegadores está ocurriendo silenciosamente. Mirando hacia atrás en la historia, desde Netscape y IE de Microsoft en los años 90, hasta el espíritu de código abierto de Firefox y Chrome de Google, la lucha de los navegadores siempre ha sido una manifestación concentrada del control de la plataforma y el cambio de paradigmas tecnológicos. Chrome ha logrado la posición de dominio gracias a su velocidad de actualización y la interconexión de su ecosistema, mientras que Google, a través de la estructura de "duopolio" entre la búsqueda y el navegador, ha formado un ciclo cerrado de entrada de información.
Sin embargo, hoy en día, este patrón está comenzando a tambalearse. El auge de los modelos de lenguaje de gran tamaño (LLM) está llevando a que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que está reduciendo el comportamiento tradicional de clics en páginas web. Al mismo tiempo, los rumores sobre la intención de Apple de reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el mercado ha comenzado a mostrar inquietud por la "ortodoxia de búsqueda".
El navegador mismo también se enfrenta a una reconfiguración de su rol. Ya no es solo una herramienta para mostrar páginas web, sino un contenedor que agrupa diversas capacidades como la entrada de datos, el comportamiento del usuario y la identidad privada. Aunque el Agente de IA es potente, para llevar a cabo interacciones complejas en las páginas, acceder a datos de identidad locales y controlar elementos de la página web, todavía necesita apoyarse en los límites de confianza y los entornos de función del navegador. El navegador está pasando de ser una interfaz humana a convertirse en una plataforma de llamadas del sistema para Agentes.
La clave del navegador del futuro radica en diseñar para el Agente de IA: no solo puede leer, sino también escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de las páginas, convirtiendo las interfaces visuales en texto estructurado que puede ser llamado por LLM, logrando mapear páginas a instrucciones y reduciendo enormemente el costo de interacción.
Los proyectos principales en el mercado han comenzado a experimentar: Perplexity está construyendo el navegador nativo Comet, utilizando IA para reemplazar los resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, utilizando LLM para mejorar la búsqueda y las funciones de bloqueo; mientras que proyectos nativos de Crypto como Donut están apuntando a nuevas entradas para la interacción entre IA y activos en cadena. La característica común de estos proyectos es: intentar reconstruir la entrada del navegador, en lugar de embellecer su capa de salida.
Para los emprendedores, las oportunidades se esconden en la relación triangular entre entrada, estructura y agente. El navegador, como la interfaz que invoca el mundo en el futuro, significa que quien pueda proporcionar "bloques de capacidad" estructurados, invocables y confiables, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO( Agent Engine Optimization), desde el tráfico de páginas hasta la invocación de cadenas de tareas, la forma y el diseño del producto están siendo reestructurados. La tercera guerra de los navegadores ocurre en la "entrada" y no en la "exhibición"; lo que decide la victoria ya no es quién atrae la atención del usuario, sino quién gana la confianza del agente y obtiene el acceso a la invocación.
Breve historia del desarrollo de los navegadores
A principios de la década de 1990, cuando Internet aún no era parte de la vida cotidiana, Netscape Navigator apareció como un barco de vela que abría un nuevo continente, abriendo las puertas del mundo digital a millones de usuarios. Este navegador no fue el primero, pero sí fue el primero en el verdadero sentido de llegar al público y dar forma a la experiencia de Internet. En ese momento, la gente podía navegar por la web de manera tan sencilla a través de una interfaz gráfica, como si de repente todo el mundo se volviera al alcance de la mano.
Sin embargo, el esplendor a menudo es efímero. Microsoft pronto se dio cuenta de la importancia de los navegadores y decidió forzar la integración de Internet Explorer en el sistema operativo Windows, convirtiéndolo en el navegador predeterminado. Esta estrategia se considera un "arma secreta de la plataforma", desmantelando directamente la posición de liderazgo de Netscape en el mercado. Muchos usuarios no eligieron IE de forma activa, sino que lo aceptaron porque era el predeterminado del sistema. IE, gracias a la capacidad de distribución de Windows, rápidamente se convirtió en el líder de la industria, mientras que Netscape cayó en una trayectoria de declive.
En medio de la adversidad, los ingenieros de Netscape eligieron un camino radical y idealista: hicieron público el código fuente del navegador, lanzando un llamado a la comunidad de código abierto. Esta decisión, como si fuera una "cesión macedónica" en el mundo de la tecnología, presagiaba el final de una era y el surgimiento de nuevas fuerzas. Este código más tarde se convirtió en la base del proyecto del navegador Mozilla, inicialmente llamado Phoenix(, que significa renacer de las cenizas), pero debido a problemas de marca, pasó por varios cambios de nombre, hasta que finalmente se llamó Firefox.
Firefox no es una simple copia de Netscape; ha logrado múltiples avances en experiencia del usuario, ecosistema de plugins, seguridad, entre otros. Su nacimiento marca la victoria del espíritu de código abierto y aporta nueva vitalidad a toda la industria. Algunos describen a Firefox como el "heredero espiritual" de Netscape, al igual que el Imperio Otomano heredó los últimos destellos del Bizancio. Esta metáfora, aunque exagerada, tiene mucho significado.
Sin embargo, años antes del lanzamiento oficial de Firefox, Microsoft ya había lanzado seis versiones de IE, aprovechando la ventaja de tiempo y la estrategia de empaquetado del sistema, lo que hizo que Firefox comenzara en una posición de desventaja, lo que condenó a esta competencia a no ser una competición justa desde la línea de partida.
Mientras tanto, otro jugador temprano también está apareciendo silenciosamente. En 1994, se lanzó el navegador Opera, que proviene de Noruega y al principio era solo un proyecto experimental. Pero a partir de la versión 7.0 en 2003, introdujo el motor Presto desarrollado internamente, siendo el primero en soportar tecnologías de vanguardia como CSS, diseño adaptable, control por voz y codificación Unicode. Aunque la cantidad de usuarios es limitada, tecnológicamente siempre ha estado a la vanguardia de la industria, convirtiéndose en "el favorito de los geeks".
Ese mismo año, Apple lanzó el navegador Safari. Este fue un giro con un significado especial. En ese momento, Microsoft había invertido 150 millones de dólares en Apple, que estaba al borde de la quiebra, para mantener la apariencia de competencia y evitar una revisión antimonopolio. Aunque el motor de búsqueda predeterminado de Safari desde su nacimiento ha sido Google, esta historia de enredos con Microsoft simboliza la relación compleja y sutil entre los gigantes de Internet: la cooperación y la competencia siempre van de la mano.
En 2007, IE7 se lanzó junto con Windows Vista, pero la respuesta del mercado fue mediocre. En cambio, Firefox, gracias a su ritmo de actualización más rápido, un mecanismo de extensiones más amigable y su atractivo natural para los desarrolladores, vio cómo su cuota de mercado aumentaba de manera constante hasta alcanzar aproximadamente el 20%. El dominio de IE comenzó a debilitarse, y la tendencia estaba cambiando.
Google, por su parte, tiene otra estrategia. Aunque comenzó a gestar su propio navegador en 2001, le tomó seis años convencer al CEO Eric Schmidt para aprobar el proyecto. Chrome se lanzó en 2008, basado en el proyecto de código abierto Chromium y en el motor WebKit utilizado por Safari. Se le apodó "el navegador pesado", pero gracias a la profunda habilidad de Google en la publicidad y la construcción de marca, rápidamente se alzó.
La clave del éxito de Chrome no son sus funciones, sino la frecuencia de sus actualizaciones, ( cada seis semanas ) y una experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox, alcanzando una cuota de mercado del 27%; seis meses después, superó a IE, completando la transición de desafiante a dominante.
Al mismo tiempo, el Internet móvil en China también está formando su propio ecosistema. El navegador UC, propiedad de Alibaba, ganó popularidad rápidamente a principios de la década de 2010, especialmente en mercados emergentes como India, Indonesia y China, gracias a su diseño ligero y características como la compresión de datos para ahorrar ancho de banda, lo que atrajo a usuarios de dispositivos de gama baja. En 2015, su participación en el mercado global de navegadores móviles superó el 17%, alcanzando un 46% en India en un momento. Pero esta victoria no fue duradera. Con el gobierno indio intensificando la revisión de seguridad de las aplicaciones chinas, el navegador UC se vio obligado a retirarse de un mercado clave, perdiendo gradualmente su antiguo esplendor.
Entrando en la década de 2020, el dominio de Chrome se ha consolidado, con una cuota de mercado global estable en aproximadamente el 65%. Cabe destacar que, aunque el motor de búsqueda de Google y el navegador Chrome pertenecen a Alphabet, desde el punto de vista del mercado son dos sistemas hegemónicos independientes: el primero controla alrededor del 90% de las entradas de búsqueda en el mundo, mientras que el segundo tiene la mayoría de los usuarios accediendo a la red a través de la "primera ventana".
Para mantener esta estructura de doble monopolio, Google no escatima en gastos. En 2022, Alphabet pagó alrededor de 20 mil millones de dólares a Apple solo para que Google mantuviera su posición como motor de búsqueda predeterminado en Safari. Algunos análisis indican que este gasto equivale al 36% de los ingresos por publicidad de búsqueda que Google obtiene del tráfico de Safari. En otras palabras, Google está pagando una "cuota de protección" para su foso.
Pero la dirección del viento ha cambiado una vez más. Con el auge de los grandes modelos de lenguaje (LLM), la búsqueda tradicional comienza a verse afectada. En 2024, la cuota de mercado de búsqueda de Google cayó del 93% al 89%; aunque sigue dominando, las grietas comienzan a aparecer. Más disruptivo aún, son los rumores sobre que Apple podría lanzar su propio motor de búsqueda de IA: si Safari cambia su búsqueda predeterminada para favorecer su propio ecosistema, esto no solo reescribirá el panorama ecológico, sino que también podría sacudir el pilar de ganancias de Alphabet. La reacción del mercado fue rápida, y las acciones de Alphabet cayeron de 170 dólares a 140 dólares, reflejando no solo el pánico de los inversores, sino también una profunda inquietud sobre el futuro de la era de búsqueda.
Desde Navigator hasta Chrome, desde la idealización del código abierto hasta la comercialización de la publicidad, desde navegadores ligeros hasta asistentes de búsqueda con IA, la batalla de los navegadores siempre ha sido una guerra sobre tecnología, plataformas, contenido y control. El campo de batalla sigue cambiando, pero la esencia nunca ha cambiado: quien controla la entrada, define el futuro.
Desde la perspectiva de los VC, apoyándose en la nueva demanda de las personas por los motores de búsqueda en la era de LLM y AI, la tercera guerra de los navegadores se está desarrollando gradualmente. A continuación se presentan algunas de las situaciones de financiamiento de proyectos en el competitivo sector de los navegadores de AI.
La arquitectura obsoleta de los navegadores modernos
Al hablar de la arquitectura del navegador, la clásica arquitectura tradicional se muestra en la siguiente imagen:
Cliente - Entrada del frontend
Consulta la entrega más reciente del Front End de Google a través de HTTPS, completa la descifrado TLS, muestreo de QoS y enrutamiento geográfico. Si se detecta tráfico anómalo (DDoS, el ) puede ser limitado o desafiado en esta capa.
Consulta de comprensión
El frontend necesita entender el significado de las palabras que el usuario escribe, y hay tres pasos: corrección ortográfica neuronal, corrigiendo "recpie" a "recipe"; expansión de sinónimos, expandiendo "how to fix bike" a "repair bicycle". Análisis de intención, determinando si la consulta es de información, navegación o intención de transacción, y asignando la solicitud Vertical.
recuperación de candidatos
La tecnología de consulta utilizada por Google se llama: índice invertido. En un índice directo, simplemente se puede indexar un archivo dado un ID. Sin embargo, los usuarios no pueden conocer el número del contenido que desean entre miles de millones de archivos, por lo que se utiliza el tradicional índice invertido para consultar qué archivos contienen las palabras clave correspondientes. A continuación, Google utiliza el índice de vectores para procesar la búsqueda semántica, es decir, buscar contenido que sea semánticamente similar a la consulta. Convierte textos, imágenes y otros contenidos en vectores de alta dimensión (embedding) y realiza búsquedas basadas en la similitud entre estos vectores. Por ejemplo, incluso si un usuario busca "cómo hacer masa para pizza", el motor de búsqueda puede devolver resultados relacionados con "guía para hacer masa de pizza", porque son semánticamente similares. Tras el índice invertido y el índice de vectores, se filtran aproximadamente cientos de miles de páginas web.
Ordenación por niveles
Los sistemas suelen filtrar cientos de miles de páginas candidatas a unas 1000 mediante características ligeras de miles de dimensiones, como BM25, TF-IDF y la puntuación de calidad de la página, formando un conjunto de candidatos preliminares. Estos sistemas se conocen en conjunto como motores de recomendación. Dependen de una gran cantidad de características generadas por diversas entidades, incluyendo el comportamiento del usuario, las propiedades de la página, la intención de búsqueda y las señales contextuales. Por ejemplo, Google integra la historia del usuario, la retroalimentación del comportamiento de otros usuarios, la semántica de la página, el significado de la consulta y otra información, al mismo tiempo que considera elementos contextuales como la hora del día (, un día específico de la semana ) y eventos externos como noticias de última hora.
Aprendizaje profundo para ordenamiento principal
En la fase de búsqueda inicial, Google utiliza tecnologías como RankBrain y Neural Matching para comprender el significado de las consultas y filtrar resultados preliminarmente relevantes de un vasto número de documentos. RankBrain es un sistema de aprendizaje automático que Google introdujo en 2015, diseñado para entender mejor el significado de las consultas de los usuarios, especialmente aquellas que aparecen por primera vez. Convierte las consultas y los documentos en representaciones vectoriales y calcula la similitud entre ellas para encontrar los resultados más relevantes. Por ejemplo, para la consulta "cómo hacer masa de pizza", incluso si no hay palabras clave que coincidan exactamente en el documento, RankBrain puede identificar contenido relacionado con "base de pizza" o "preparación de masa".
Neural Matching es otra tecnología lanzada por Google en 2018, diseñada para comprender más profundamente la relación semántica entre consultas y documentos. Utiliza modelos de redes neuronales para captar relaciones difusas entre palabras, ayudando a Google a coincidir mejor las consultas con el contenido de las páginas web. Por ejemplo, para la consulta "¿por qué el ventilador de mi computadora portátil suena muy fuerte?", Neural Matching puede entender que el usuario puede estar buscando información sobre problemas de sobrecalentamiento, acumulación de polvo o alto uso de CPU, incluso si estas palabras no aparecen directamente en la consulta.
Reordenamiento profundo: Aplicación del modelo BERT
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
16 me gusta
Recompensa
16
9
Compartir
Comentar
0/400
MoonlightGamer
· 07-10 09:24
Chrome no puede soportarlo.
Ver originalesResponder0
AirdropHunterXM
· 07-10 07:24
¿Qué tontería? Ha llegado la IA.
Ver originalesResponder0
ApeWithNoChain
· 07-10 02:02
No puedo soportar que el navegador vuelva a estar en modo de despliegue.
Ver originalesResponder0
0xSoulless
· 07-07 10:13
¡Eh! Otra ola de tomar a la gente por tonta en el festín.
Ver originalesResponder0
DaoTherapy
· 07-07 10:12
Deja de hacer eso, ya lo entendió Google.
Ver originalesResponder0
CryptoCross-TalkClub
· 07-07 10:10
Mencióname con el símbolo de dólar, tonto del mundo Cripto de tres años, cada noche a las 8 en punto comienza a contar chistes.
El navegador de IA reconstruye la entrada a Internet, se inicia la tercera guerra de los navegadores.
Navegador AI: El nuevo campo de batalla para reconstruir la entrada a Internet
La tercera guerra de los navegadores está ocurriendo silenciosamente. Mirando hacia atrás en la historia, desde Netscape y IE de Microsoft en los años 90, hasta el espíritu de código abierto de Firefox y Chrome de Google, la lucha de los navegadores siempre ha sido una manifestación concentrada del control de la plataforma y el cambio de paradigmas tecnológicos. Chrome ha logrado la posición de dominio gracias a su velocidad de actualización y la interconexión de su ecosistema, mientras que Google, a través de la estructura de "duopolio" entre la búsqueda y el navegador, ha formado un ciclo cerrado de entrada de información.
Sin embargo, hoy en día, este patrón está comenzando a tambalearse. El auge de los modelos de lenguaje de gran tamaño (LLM) está llevando a que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que está reduciendo el comportamiento tradicional de clics en páginas web. Al mismo tiempo, los rumores sobre la intención de Apple de reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el mercado ha comenzado a mostrar inquietud por la "ortodoxia de búsqueda".
El navegador mismo también se enfrenta a una reconfiguración de su rol. Ya no es solo una herramienta para mostrar páginas web, sino un contenedor que agrupa diversas capacidades como la entrada de datos, el comportamiento del usuario y la identidad privada. Aunque el Agente de IA es potente, para llevar a cabo interacciones complejas en las páginas, acceder a datos de identidad locales y controlar elementos de la página web, todavía necesita apoyarse en los límites de confianza y los entornos de función del navegador. El navegador está pasando de ser una interfaz humana a convertirse en una plataforma de llamadas del sistema para Agentes.
La clave del navegador del futuro radica en diseñar para el Agente de IA: no solo puede leer, sino también escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de las páginas, convirtiendo las interfaces visuales en texto estructurado que puede ser llamado por LLM, logrando mapear páginas a instrucciones y reduciendo enormemente el costo de interacción.
Los proyectos principales en el mercado han comenzado a experimentar: Perplexity está construyendo el navegador nativo Comet, utilizando IA para reemplazar los resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, utilizando LLM para mejorar la búsqueda y las funciones de bloqueo; mientras que proyectos nativos de Crypto como Donut están apuntando a nuevas entradas para la interacción entre IA y activos en cadena. La característica común de estos proyectos es: intentar reconstruir la entrada del navegador, en lugar de embellecer su capa de salida.
Para los emprendedores, las oportunidades se esconden en la relación triangular entre entrada, estructura y agente. El navegador, como la interfaz que invoca el mundo en el futuro, significa que quien pueda proporcionar "bloques de capacidad" estructurados, invocables y confiables, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO( Agent Engine Optimization), desde el tráfico de páginas hasta la invocación de cadenas de tareas, la forma y el diseño del producto están siendo reestructurados. La tercera guerra de los navegadores ocurre en la "entrada" y no en la "exhibición"; lo que decide la victoria ya no es quién atrae la atención del usuario, sino quién gana la confianza del agente y obtiene el acceso a la invocación.
Breve historia del desarrollo de los navegadores
A principios de la década de 1990, cuando Internet aún no era parte de la vida cotidiana, Netscape Navigator apareció como un barco de vela que abría un nuevo continente, abriendo las puertas del mundo digital a millones de usuarios. Este navegador no fue el primero, pero sí fue el primero en el verdadero sentido de llegar al público y dar forma a la experiencia de Internet. En ese momento, la gente podía navegar por la web de manera tan sencilla a través de una interfaz gráfica, como si de repente todo el mundo se volviera al alcance de la mano.
Sin embargo, el esplendor a menudo es efímero. Microsoft pronto se dio cuenta de la importancia de los navegadores y decidió forzar la integración de Internet Explorer en el sistema operativo Windows, convirtiéndolo en el navegador predeterminado. Esta estrategia se considera un "arma secreta de la plataforma", desmantelando directamente la posición de liderazgo de Netscape en el mercado. Muchos usuarios no eligieron IE de forma activa, sino que lo aceptaron porque era el predeterminado del sistema. IE, gracias a la capacidad de distribución de Windows, rápidamente se convirtió en el líder de la industria, mientras que Netscape cayó en una trayectoria de declive.
En medio de la adversidad, los ingenieros de Netscape eligieron un camino radical y idealista: hicieron público el código fuente del navegador, lanzando un llamado a la comunidad de código abierto. Esta decisión, como si fuera una "cesión macedónica" en el mundo de la tecnología, presagiaba el final de una era y el surgimiento de nuevas fuerzas. Este código más tarde se convirtió en la base del proyecto del navegador Mozilla, inicialmente llamado Phoenix(, que significa renacer de las cenizas), pero debido a problemas de marca, pasó por varios cambios de nombre, hasta que finalmente se llamó Firefox.
Firefox no es una simple copia de Netscape; ha logrado múltiples avances en experiencia del usuario, ecosistema de plugins, seguridad, entre otros. Su nacimiento marca la victoria del espíritu de código abierto y aporta nueva vitalidad a toda la industria. Algunos describen a Firefox como el "heredero espiritual" de Netscape, al igual que el Imperio Otomano heredó los últimos destellos del Bizancio. Esta metáfora, aunque exagerada, tiene mucho significado.
Sin embargo, años antes del lanzamiento oficial de Firefox, Microsoft ya había lanzado seis versiones de IE, aprovechando la ventaja de tiempo y la estrategia de empaquetado del sistema, lo que hizo que Firefox comenzara en una posición de desventaja, lo que condenó a esta competencia a no ser una competición justa desde la línea de partida.
Mientras tanto, otro jugador temprano también está apareciendo silenciosamente. En 1994, se lanzó el navegador Opera, que proviene de Noruega y al principio era solo un proyecto experimental. Pero a partir de la versión 7.0 en 2003, introdujo el motor Presto desarrollado internamente, siendo el primero en soportar tecnologías de vanguardia como CSS, diseño adaptable, control por voz y codificación Unicode. Aunque la cantidad de usuarios es limitada, tecnológicamente siempre ha estado a la vanguardia de la industria, convirtiéndose en "el favorito de los geeks".
Ese mismo año, Apple lanzó el navegador Safari. Este fue un giro con un significado especial. En ese momento, Microsoft había invertido 150 millones de dólares en Apple, que estaba al borde de la quiebra, para mantener la apariencia de competencia y evitar una revisión antimonopolio. Aunque el motor de búsqueda predeterminado de Safari desde su nacimiento ha sido Google, esta historia de enredos con Microsoft simboliza la relación compleja y sutil entre los gigantes de Internet: la cooperación y la competencia siempre van de la mano.
En 2007, IE7 se lanzó junto con Windows Vista, pero la respuesta del mercado fue mediocre. En cambio, Firefox, gracias a su ritmo de actualización más rápido, un mecanismo de extensiones más amigable y su atractivo natural para los desarrolladores, vio cómo su cuota de mercado aumentaba de manera constante hasta alcanzar aproximadamente el 20%. El dominio de IE comenzó a debilitarse, y la tendencia estaba cambiando.
Google, por su parte, tiene otra estrategia. Aunque comenzó a gestar su propio navegador en 2001, le tomó seis años convencer al CEO Eric Schmidt para aprobar el proyecto. Chrome se lanzó en 2008, basado en el proyecto de código abierto Chromium y en el motor WebKit utilizado por Safari. Se le apodó "el navegador pesado", pero gracias a la profunda habilidad de Google en la publicidad y la construcción de marca, rápidamente se alzó.
La clave del éxito de Chrome no son sus funciones, sino la frecuencia de sus actualizaciones, ( cada seis semanas ) y una experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox, alcanzando una cuota de mercado del 27%; seis meses después, superó a IE, completando la transición de desafiante a dominante.
Al mismo tiempo, el Internet móvil en China también está formando su propio ecosistema. El navegador UC, propiedad de Alibaba, ganó popularidad rápidamente a principios de la década de 2010, especialmente en mercados emergentes como India, Indonesia y China, gracias a su diseño ligero y características como la compresión de datos para ahorrar ancho de banda, lo que atrajo a usuarios de dispositivos de gama baja. En 2015, su participación en el mercado global de navegadores móviles superó el 17%, alcanzando un 46% en India en un momento. Pero esta victoria no fue duradera. Con el gobierno indio intensificando la revisión de seguridad de las aplicaciones chinas, el navegador UC se vio obligado a retirarse de un mercado clave, perdiendo gradualmente su antiguo esplendor.
Entrando en la década de 2020, el dominio de Chrome se ha consolidado, con una cuota de mercado global estable en aproximadamente el 65%. Cabe destacar que, aunque el motor de búsqueda de Google y el navegador Chrome pertenecen a Alphabet, desde el punto de vista del mercado son dos sistemas hegemónicos independientes: el primero controla alrededor del 90% de las entradas de búsqueda en el mundo, mientras que el segundo tiene la mayoría de los usuarios accediendo a la red a través de la "primera ventana".
Para mantener esta estructura de doble monopolio, Google no escatima en gastos. En 2022, Alphabet pagó alrededor de 20 mil millones de dólares a Apple solo para que Google mantuviera su posición como motor de búsqueda predeterminado en Safari. Algunos análisis indican que este gasto equivale al 36% de los ingresos por publicidad de búsqueda que Google obtiene del tráfico de Safari. En otras palabras, Google está pagando una "cuota de protección" para su foso.
Pero la dirección del viento ha cambiado una vez más. Con el auge de los grandes modelos de lenguaje (LLM), la búsqueda tradicional comienza a verse afectada. En 2024, la cuota de mercado de búsqueda de Google cayó del 93% al 89%; aunque sigue dominando, las grietas comienzan a aparecer. Más disruptivo aún, son los rumores sobre que Apple podría lanzar su propio motor de búsqueda de IA: si Safari cambia su búsqueda predeterminada para favorecer su propio ecosistema, esto no solo reescribirá el panorama ecológico, sino que también podría sacudir el pilar de ganancias de Alphabet. La reacción del mercado fue rápida, y las acciones de Alphabet cayeron de 170 dólares a 140 dólares, reflejando no solo el pánico de los inversores, sino también una profunda inquietud sobre el futuro de la era de búsqueda.
Desde Navigator hasta Chrome, desde la idealización del código abierto hasta la comercialización de la publicidad, desde navegadores ligeros hasta asistentes de búsqueda con IA, la batalla de los navegadores siempre ha sido una guerra sobre tecnología, plataformas, contenido y control. El campo de batalla sigue cambiando, pero la esencia nunca ha cambiado: quien controla la entrada, define el futuro.
Desde la perspectiva de los VC, apoyándose en la nueva demanda de las personas por los motores de búsqueda en la era de LLM y AI, la tercera guerra de los navegadores se está desarrollando gradualmente. A continuación se presentan algunas de las situaciones de financiamiento de proyectos en el competitivo sector de los navegadores de AI.
La arquitectura obsoleta de los navegadores modernos
Al hablar de la arquitectura del navegador, la clásica arquitectura tradicional se muestra en la siguiente imagen:
Cliente - Entrada del frontend
Consulta la entrega más reciente del Front End de Google a través de HTTPS, completa la descifrado TLS, muestreo de QoS y enrutamiento geográfico. Si se detecta tráfico anómalo (DDoS, el ) puede ser limitado o desafiado en esta capa.
Consulta de comprensión
El frontend necesita entender el significado de las palabras que el usuario escribe, y hay tres pasos: corrección ortográfica neuronal, corrigiendo "recpie" a "recipe"; expansión de sinónimos, expandiendo "how to fix bike" a "repair bicycle". Análisis de intención, determinando si la consulta es de información, navegación o intención de transacción, y asignando la solicitud Vertical.
recuperación de candidatos
La tecnología de consulta utilizada por Google se llama: índice invertido. En un índice directo, simplemente se puede indexar un archivo dado un ID. Sin embargo, los usuarios no pueden conocer el número del contenido que desean entre miles de millones de archivos, por lo que se utiliza el tradicional índice invertido para consultar qué archivos contienen las palabras clave correspondientes. A continuación, Google utiliza el índice de vectores para procesar la búsqueda semántica, es decir, buscar contenido que sea semánticamente similar a la consulta. Convierte textos, imágenes y otros contenidos en vectores de alta dimensión (embedding) y realiza búsquedas basadas en la similitud entre estos vectores. Por ejemplo, incluso si un usuario busca "cómo hacer masa para pizza", el motor de búsqueda puede devolver resultados relacionados con "guía para hacer masa de pizza", porque son semánticamente similares. Tras el índice invertido y el índice de vectores, se filtran aproximadamente cientos de miles de páginas web.
Ordenación por niveles
Los sistemas suelen filtrar cientos de miles de páginas candidatas a unas 1000 mediante características ligeras de miles de dimensiones, como BM25, TF-IDF y la puntuación de calidad de la página, formando un conjunto de candidatos preliminares. Estos sistemas se conocen en conjunto como motores de recomendación. Dependen de una gran cantidad de características generadas por diversas entidades, incluyendo el comportamiento del usuario, las propiedades de la página, la intención de búsqueda y las señales contextuales. Por ejemplo, Google integra la historia del usuario, la retroalimentación del comportamiento de otros usuarios, la semántica de la página, el significado de la consulta y otra información, al mismo tiempo que considera elementos contextuales como la hora del día (, un día específico de la semana ) y eventos externos como noticias de última hora.
Aprendizaje profundo para ordenamiento principal
En la fase de búsqueda inicial, Google utiliza tecnologías como RankBrain y Neural Matching para comprender el significado de las consultas y filtrar resultados preliminarmente relevantes de un vasto número de documentos. RankBrain es un sistema de aprendizaje automático que Google introdujo en 2015, diseñado para entender mejor el significado de las consultas de los usuarios, especialmente aquellas que aparecen por primera vez. Convierte las consultas y los documentos en representaciones vectoriales y calcula la similitud entre ellas para encontrar los resultados más relevantes. Por ejemplo, para la consulta "cómo hacer masa de pizza", incluso si no hay palabras clave que coincidan exactamente en el documento, RankBrain puede identificar contenido relacionado con "base de pizza" o "preparación de masa".
Neural Matching es otra tecnología lanzada por Google en 2018, diseñada para comprender más profundamente la relación semántica entre consultas y documentos. Utiliza modelos de redes neuronales para captar relaciones difusas entre palabras, ayudando a Google a coincidir mejor las consultas con el contenido de las páginas web. Por ejemplo, para la consulta "¿por qué el ventilador de mi computadora portátil suena muy fuerte?", Neural Matching puede entender que el usuario puede estar buscando información sobre problemas de sobrecalentamiento, acumulación de polvo o alto uso de CPU, incluso si estas palabras no aparecen directamente en la consulta.
Reordenamiento profundo: Aplicación del modelo BERT
En la selección preliminar de