O navegador AI reconstrói a entrada da internet. A terceira guerra dos navegadores começa.

Navegador AI: O novo campo de batalha para reconstruir a entrada da internet

A terceira guerra dos navegadores está se desenrolando silenciosamente. Olhando para a história, desde o Netscape e o IE da Microsoft nos anos 90, até o espírito de código aberto do Firefox e o Chrome do Google, a disputa entre navegadores sempre foi uma expressão concentrada do controle da plataforma e das mudanças nos paradigmas tecnológicos. O Chrome conquistou a posição de domínio graças à sua velocidade de atualização e interconexão ecológica, enquanto o Google formou um ciclo fechado de entrada de informações através da estrutura de "duopólio" entre busca e navegador.

No entanto, hoje, esse padrão está sendo abalado. A ascensão dos modelos de linguagem de grande escala (LLM) está fazendo com que cada vez mais usuários completem tarefas na página de resultados de pesquisa com "zero cliques", reduzindo o comportamento tradicional de cliques em páginas da web. Ao mesmo tempo, rumores sobre a Apple pretendendo substituir o mecanismo de busca padrão no Safari ameaçam ainda mais a base de lucros da Alphabet, e o mercado já começou a mostrar inquietação em relação à "ortodoxia da busca".

O próprio navegador está a passar por uma reconfiguração de funções. Ele não é apenas uma ferramenta para exibir páginas da web, mas sim um recipiente que reúne várias capacidades, como entrada de dados, comportamento do usuário, identidade de privacidade, entre outras. Embora o Agente de IA seja poderoso, para realizar interações complexas em páginas, chamar dados de identidade locais e controlar elementos da página, ainda é necessário recorrer aos limites de confiança e ao sandbox funcional do navegador. O navegador está a transformar-se de uma interface humana para uma plataforma de chamadas de sistema para Agentes.

A chave para o navegador do futuro está em projetar para o Agente de IA - não apenas ler, mas também escrever e executar. Projetos como o Browser Use estão tentando semantizar a estrutura da página, transformando a interface visual em texto estruturado que pode ser chamado por LLM, realizando o mapeamento de página para instruções e reduzindo significativamente o custo de interação.

Os projetos principais no mercado já começaram a experimentar: Perplexity construiu o navegador nativo Comet, substituindo os resultados de busca tradicionais por IA; Brave combina proteção de privacidade com raciocínio local, usando LLM para melhorar a busca e funções de bloqueio; enquanto projetos nativos de Crypto como Donut visam uma nova entrada para a interação entre IA e ativos em blockchain. A característica comum desses projetos é: tentam reestruturar a interface de entrada do navegador, em vez de embelezar sua camada de saída.

Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agente. O navegador, como a interface para a chamada do mundo no futuro, significa que quem puder fornecer "blocos de habilidade" estruturados, chamáveis e confiáveis, poderá se tornar parte integrante da nova geração de plataformas. Desde SEO até AEO(Agente Engine Optimization), desde o tráfego da página até a chamada da cadeia de tarefas, a forma e o design do produto estão sendo reestruturados. A terceira guerra dos navegadores acontece na "entrada" e não na "exibição"; o que decide o vencedor não é mais quem capta a atenção do usuário, mas quem ganha a confiança do agente e obtém a entrada para a chamada.

Breve História do Desenvolvimento dos Navegadores

No início da década de 90, quando a internet ainda não fazia parte da vida cotidiana, o Netscape Navigator surgiu como um barco à vela que abre um novo continente, abrindo as portas do mundo digital para milhões de usuários. Este navegador não foi o primeiro, mas foi o primeiro a realmente alcançar o público em geral e moldar a experiência da internet. Naquela época, as pessoas podiam, pela primeira vez, navegar nas páginas da web de forma tão fácil através de uma interface gráfica, como se o mundo inteiro de repente se tornasse ao alcance das mãos.

No entanto, o esplendor muitas vezes é efémero. A Microsoft rapidamente percebeu a importância dos navegadores e decidiu forçar o Internet Explorer a ser incluído no sistema operativo Windows, tornando-o o navegador padrão. Esta estratégia é considerada uma "arma secreta da plataforma", que desmantelou diretamente a posição de liderança de mercado da Netscape. Muitos usuários não escolheram proativamente o IE, mas o aceitaram apenas porque era o padrão do sistema. O IE, aproveitando a capacidade de distribuição do Windows, rapidamente se tornou o líder do setor, enquanto a Netscape caiu em um caminho de declínio.

Em tempos difíceis, os engenheiros da Netscape escolheram um caminho radical e idealista - tornaram o código-fonte do navegador público, convocando a comunidade de código aberto. Esta decisão parecia ser uma "cede macedônia" na indústria tecnológica, prenunciando o fim de uma era e a ascensão de novas forças. Este código mais tarde se tornou a base do projeto do navegador Mozilla, inicialmente nomeado Phoenix(, que significa renascimento da fênix), mas devido a problemas de marca passou por várias mudanças de nome, até ser finalmente chamado de Firefox.

O Firefox não é uma simples cópia do Netscape; ele alcançou várias inovações em termos de experiência do usuário, ecossistema de plugins e segurança. O seu surgimento marcou a vitória do espírito de código aberto e injetou nova vitalidade em toda a indústria. Alguns descrevem o Firefox como o "herdeiro espiritual" do Netscape, assim como o Império Otomano herdou o último brilho do Império Bizantino. Embora essa metáfora seja exagerada, possui um significado profundo.

Mas nos anos anteriores ao lançamento oficial do Firefox, a Microsoft já havia lançado seis versões do IE, aproveitando a vantagem de tempo e a estratégia de empacotamento do sistema, fazendo com que o Firefox começasse em uma posição de perseguição, tornando esta competição tudo menos uma disputa justa à linha de partida.

Entretanto, outro jogador precoce também está surgindo silenciosamente. Em 1994, o navegador Opera foi lançado, originário da Noruega, e inicialmente era apenas um projeto experimental. Mas a partir da versão 7.0, em 2003, ele introduziu o motor Presto desenvolvido internamente, sendo o primeiro a suportar tecnologias de ponta como CSS, layouts responsivos, controle por voz e codificação Unicode. Embora o número de usuários tenha sido limitado, a tecnologia sempre esteve à frente da indústria, tornando-se "o favorito dos geeks".

No mesmo ano, a Apple lançou o navegador Safari. Esta foi uma reviravolta significativa. Naquela época, a Microsoft havia investido 150 milhões de dólares na Apple, que estava à beira da falência, para manter as aparências de concorrência e evitar uma investigação antitruste. Embora o mecanismo de busca padrão do Safari desde o seu nascimento tenha sido o Google, essa história de envolvimento com a Microsoft simboliza a relação complexa e sutil entre os gigantes da internet: cooperação e competição estão sempre entrelaçadas.

Em 2007, o IE7 foi lançado com o Windows Vista, mas o feedback do mercado foi morno. Em contraste, o Firefox, com seu ritmo de atualizações mais rápido, um mecanismo de extensões mais amigável e um apelo natural para os desenvolvedores, viu sua participação de mercado aumentar de forma constante para cerca de 20%. O domínio do IE estava gradualmente se afrouxando, e o vento estava mudando.

O Google adotou uma abordagem diferente. Embora tenha começado a trabalhar em seu próprio navegador em 2001, levou seis anos para convencer o CEO Eric Schmidt a aprovar o projeto. O Chrome foi lançado em 2008, baseado no projeto de código aberto Chromium e no motor WebKit usado pelo Safari. Foi apelidado de "navegador pesado", mas, graças à profunda habilidade do Google em publicidade e construção de marcas, rapidamente se destacou.

A chave do Chrome não são as funcionalidades, mas sim o ritmo frequente de atualizações de versão ( a cada seis semanas ) com uma experiência unificada em todas as plataformas. Em novembro de 2011, o Chrome superou pela primeira vez o Firefox, alcançando uma quota de mercado de 27%; seis meses depois, superou novamente o IE, completando a transição de desafiante a dominador.

Ao mesmo tempo, a internet móvel na China também está formando seu próprio ecossistema. O navegador UC, pertencente ao Alibaba, rapidamente ganhou popularidade no início da década de 2010, especialmente em mercados emergentes como Índia, Indonésia e China, conquistando a preferência de usuários de dispositivos de baixo custo com seu design leve e recursos de compressão de dados para economizar tráfego. Em 2015, sua participação no mercado global de navegadores móveis ultrapassou 17%, chegando a 46% na Índia em um determinado momento. No entanto, essa vitória não foi duradoura. Com o governo indiano reforçando a revisão de segurança de aplicativos chineses, o UC foi forçado a sair de um mercado-chave, perdendo gradualmente seu antigo esplendor.

Entrando na década de 2020, a posição dominante do Chrome foi estabelecida, com uma quota de mercado global estabilizada em cerca de 65%. Vale a pena notar que, embora o motor de busca do Google e o navegador Chrome pertençam ambos à Alphabet, do ponto de vista de mercado, são dois sistemas hegemônicos independentes - o primeiro controla cerca de 90% das entradas de busca no mundo, enquanto o segundo domina a "primeira janela" pela qual a maioria dos usuários acessa a internet.

Para manter essa estrutura de duopólio, o Google não hesitou em investir pesadamente. Em 2022, a Alphabet pagou cerca de 20 bilhões de dólares à Apple, apenas para que o Google mantivesse sua posição de pesquisa padrão no Safari. Alguns analistas apontam que esse gasto equivale a 36% da receita de anúncios de pesquisa que o Google obtém do tráfego do Safari. Em outras palavras, o Google está pagando uma "taxa de proteção" para sua fortaleza.

Mas a direção mudou mais uma vez. Com a ascensão dos grandes modelos de linguagem (LLM), a busca tradicional começou a ser impactada. Em 2024, a participação de mercado de busca do Google caiu de 93% para 89%, embora ainda domine, as fissuras começaram a aparecer. Mais disruptiva é a rumor sobre a Apple lançar seu próprio motor de busca de IA - se o Safari mudar seu motor de busca padrão para suas próprias soluções, isso não apenas reescreverá o ecossistema, mas poderá abalar o pilar de lucro da Alphabet. O mercado reagiu rapidamente, com as ações da Alphabet caindo de 170 dólares para 140 dólares, refletindo não apenas o pânico dos investidores, mas também uma profunda insegurança sobre a direção futura da era das buscas.

Da Navigator ao Chrome, do idealismo de código aberto à comercialização de publicidade, do navegador leve ao assistente de busca AI, a batalha dos navegadores sempre foi uma guerra sobre tecnologia, plataformas, conteúdos e controle. O campo de batalha está constantemente mudando, mas a essência nunca muda: quem controla a entrada, define o futuro.

Na visão dos VC, apoiado pelas novas necessidades das pessoas em relação aos motores de busca na era do LLM e da IA, a terceira guerra dos navegadores está gradualmente se desenrolando. Abaixo está a situação de financiamento de alguns projetos conhecidos na pista de navegadores de IA.

A velha arquitetura dos navegadores modernos

Ao falar sobre a arquitetura do navegador, a arquitetura tradicional clássica é mostrada na figura abaixo:

Cliente - Entrada do front-end

Consultar o Google Front End mais próximo via HTTPS, completar a descriptografia TLS, amostragem de QoS e roteamento geográfico. Se for detectado tráfego anômalo (DDoS, a captura automática ) pode ser limitada ou desafiada nesta camada.

Consulta de compreensão

A interface precisa entender o significado das palavras digitadas pelo usuário, com três etapas: correção ortográfica neural, corrigindo "recpie" para "recipe"; expansão de sinônimos, expandindo "how to fix bike" para "repair bicycle". Análise de intenção, determinando se a consulta é de informação, navegação ou intenção de transação, e atribuindo a solicitação Vertical.

candidatos de recall

A tecnologia de consulta utilizada pelo Google é chamada de: índice invertido. Em um índice direto, dado um ID, podemos indexar o arquivo. No entanto, os usuários não podem saber o número do conteúdo desejado entre trilhões de arquivos, portanto, foi adotado um índice invertido muito tradicional, que consulta quais arquivos têm palavras-chave correspondentes por meio do conteúdo. Em seguida, o Google utiliza índices vetoriais para lidar com buscas semânticas, ou seja, para encontrar conteúdos que tenham significados semelhantes à consulta. Ele converte texto, imagens e outros conteúdos em vetores de alta dimensão ( embedding ) e realiza a busca com base na similaridade entre esses vetores. Por exemplo, mesmo que o usuário busque "como fazer massa de pizza", o mecanismo de busca pode retornar resultados relacionados a "guia para fazer massa de pizza", porque eles são semanticamente semelhantes. Após o índice invertido e o índice vetorial, cerca de cem mil páginas da web são pré-selecionadas.

Ordenação em múltiplos níveis

Os sistemas geralmente filtram páginas candidatas em escala de centenas de milhares para cerca de 1000, utilizando milhares de características leves, como BM25, TF-IDF e pontuação de qualidade da página, formando um conjunto inicial de candidatos. Esses sistemas são coletivamente conhecidos como motores de recomendação. Eles dependem de uma vasta gama de características geradas por várias entidades, incluindo comportamento do usuário, atributos da página, intenção de consulta e sinais de contexto. Por exemplo, o Google integra informações como o histórico do usuário, feedback de comportamento de outros usuários, semântica da página, significado da consulta, entre outras, enquanto também considera fatores contextuais, como o período do dia (, dias específicos da semana ) e eventos externos, como notícias em tempo real.

Aprendizagem profunda para classificação principal

Na fase de pesquisa preliminar, o Google utiliza tecnologias como RankBrain e Neural Matching para entender o significado da consulta e filtrar resultados relevantes de um vasto número de documentos. RankBrain é um sistema de aprendizado de máquina introduzido pelo Google em 2015, destinado a compreender melhor o significado das consultas dos usuários, especialmente aquelas que aparecem pela primeira vez. Ele transforma consultas e documentos em representações vetoriais, calculando a similaridade entre eles para encontrar os resultados mais relevantes. Por exemplo, para a consulta "como fazer massa de pizza", mesmo que não haja palavras-chave correspondentes nos documentos, o RankBrain consegue identificar conteúdos relacionados a "base de pizza" ou "preparação de massa".

O Neural Matching é uma tecnologia lançada pelo Google em 2018, que visa compreender mais profundamente a relação semântica entre consultas e documentos. Ele utiliza modelos de redes neurais para capturar relações vagas entre palavras, ajudando o Google a combinar melhor consultas e conteúdo da web. Por exemplo, para a consulta "por que o ventilador do meu laptop faz muito barulho", o Neural Matching pode entender que o usuário pode estar procurando informações de solução de problemas relacionadas a superaquecimento, acúmulo de poeira ou alta utilização da CPU, mesmo que essas palavras não apareçam diretamente na consulta.

Reorganização Profunda: Aplicação do Modelo BERT

Na triagem inicial

AGENT2.34%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 9
  • Partilhar
Comentar
0/400
MoonlightGamervip
· 07-10 09:24
Chrome não dá para aguentar
Ver originalResponder0
AirdropHunterXMvip
· 07-10 07:24
Procurar um fio de cabelo, a IA chegou.
Ver originalResponder0
ApeWithNoChainvip
· 07-10 02:02
Não consigo resistir e o navegador voltou a ser um desafio.
Ver originalResponder0
0xSoullessvip
· 07-07 10:13
Ah, mais uma festa de fazer as pessoas de parvas.
Ver originalResponder0
DaoTherapyvip
· 07-07 10:12
Deixa para lá, já deixaram o Google entender.
Ver originalResponder0
CryptoCross-TalkClubvip
· 07-07 10:10
Atraia-me com o símbolo do dólar à frente, idiotas do mundo crypto há três anos, todos os dias às 20 horas, pontualmente, falo de comédia.
Ver originalResponder0
HypotheticalLiquidatorvip
· 07-07 10:09
Mais uma liquidação sistêmica está prestes a acontecer
Ver originalResponder0
GweiTooHighvip
· 07-07 09:48
Um dia também o Google terá sua queda.
Ver originalResponder0
ser_ngmivip
· 07-07 09:47
É outra vez AI e guerra a fazer palhaçadas.
Ver originalResponder0
Ver mais
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)