Source : Zero State LT, auteur : Zhuo Xinyue, éditeur : Hu Zhanjia
À quelle vitesse le grand modèle passe-t-il du concept à la mise en œuvre ?
La Conférence mondiale sur l'intelligence artificielle 2023 (WAIC 2023), l'événement le plus accrocheur du cercle technologique ces derniers temps, a donné une réponse qui a choqué tout le monde : six mois ! Une demi-année n'est pas trop longue pour n'importe quelle piste technologique, et même certaines pistes n'en sont qu'au stade de "l'enfance", mais la piste modèle à grande échelle a achevé le processus du concept à la mise en œuvre en si peu de temps.
Au premier trimestre de cette année, l'industrie discutait encore de la question du "si oui ou non". Au deuxième trimestre, la tendance des différents grands fabricants à se regrouper pour fabriquer de grands modèles est que les acteurs répondent "comment faire". .
Cette réponse, en substance, a été concentrée par plus de 30 fabricants de modèles à grande échelle participant à la conférence WAIC - résoudre d'abord les problèmes techniques, suivis de la mise en œuvre de la scène, et enfin commerciaux et à grande échelle.
"Auparavant, les difficultés de mise en œuvre de l'intelligence artificielle se situaient davantage au niveau technique, comme dans le domaine de la conduite autonome. Elle est développée depuis de nombreuses années, mais la commercialisation empêche toujours les acteurs de voir l'aube." après avoir visité la conférence WAIC: "Relative Cependant, il convient de noter que la concurrence sur le marché des grands modèles sera plus intense."
Lors de cette conférence WAIC, plus de 30 entreprises se sont concentrées sur « montrer leurs muscles », y compris des géants tels que Baidu, Tencent, Ali, Huawei et JD.com, ainsi que des acteurs dans des domaines verticaux tels que SenseTime et NetEase.
À ce moment-là, on a appris que le chef du premier groupe de travail sur la normalisation des modèles à grande échelle de mon pays était détenu conjointement par le Laboratoire d'intelligence artificielle de Shanghai et Baidu, Huawei, Ali et d'autres sociétés. Ces premières sociétés présélectionnées ont également reçu le " Titre de l'équipe nationale". ** Il existe divers signes indiquant qu'une bataille PK modèle à grande échelle de plus grande dimension menée par "l'équipe nationale" a officiellement commencé. **
De "danse modèle de groupe" à "leader d'équipe nationale"
Depuis le début de cette année, les grands modèles sont sans aucun doute devenus le point le plus en vogue de la technologie et sont rapidement devenus le "thème principal" de diverses entreprises. Il semble qu'aucun grand constructeur n'ose dire publiquement qu'il ne sera pas impliqué là-dedans. Selon des statistiques incomplètes, au premier semestre de cette année, près d'une centaine d'entreprises ont officiellement annoncé la construction de modèles à grande échelle.
De grandes sociétés Internet telles qu'Ali, Baidu, Tencent, ByteDance et JD.com, des sociétés d'IA représentées par iFlytek et SenseTime, et diverses industries représentées par des sociétés éducatives telles que Kidswant et des sociétés financières telles que Huashun Companies sont entrées dans le jeu les unes après les autres. .
De plus, on assiste à une montée en puissance rapide dans le pays pour démarrer une entreprise de modèles à grande échelle d'IA.De nombreux géants de la technologie, cadres et anciens dirigeants de grands fabricants se sont consacrés aux modèles à grande échelle pour démarrer une nouvelle entreprise. Par exemple, Wang Huiwen, le co-fondateur du Meituan original, est entré dans le grand modèle d'IA avec un profil élevé (actuellement, "Light Years Beyond" établi par la société a été acquis par Meituan) ; Li Kaifu, Le PDG d'Innovation Works, Wang Xiaochuan, fondateur de Sohu, et l'ancien pionnier des affaires de JD.com AI Zhou Bowen et d'autres ont rejoint la vague entrepreneuriale des grands modèles d'IA. Bien que cette scène ne soit pas aussi spectaculaire que la "guerre des mille régiments" à l'époque, il suffit de surprendre le monde extérieur pour une piste de modèle à grande échelle qui nécessite des seuils techniques extrêmement élevés d'intelligence artificielle + solutions.
Ces dernières années, la voie vers B a été extrêmement chaude, et la demande de transformation numérique et de mise à niveau des entreprises est devenue de plus en plus forte, et la réduction des coûts et l'amélioration de l'efficacité sont également les principales exigences des entreprises. Même de nombreuses personnes dans l'industrie pensent que les modèles à grande échelle sont devenus le domaine le plus prometteur pour une croissance progressive dans le cercle technologique. Et cela est devenu l'une des raisons de la popularité rapide des grands modèles.
** Lors de la conférence WAIC qui s'est tenue à Shanghai du 6 au 8 juillet, plus de 30 entreprises de modèles à grande échelle ont concouru pour afficher la disposition et les réalisations au niveau des modèles à grande échelle, qui est également devenu un événement marquant dans le développement de l'industrie . **
Baidu, en tant que premier fabricant en Chine à annoncer l'intelligence artificielle All In, a démontré son style Wenxinyi, l'un des "trésors de l'hôtel de ville", lors de la conférence, permettant à tous ceux qui sont entrés dans le hall d'exposition de se rendre compte que tout le monde peut "P- image". Huawei a déplacé son Atlas 900 PoD A2 sur la scène pour montrer sa puissance de calcul de base du côté matériel ; lors du sous-forum Alibaba Cloud, la "Tongyi Family" a ajouté un modèle de peinture AI "Tongyi Wanxiang", qui est Ali Le troisième produit grand modèle annoncé dans trois mois.
L'engouement de l'industrie pour les grands modèles a accéléré la mise en place de "l'équipe nationale".
Le 7 juillet, lors de la conférence WACI 2023, la normalisation nationale de l'intelligence artificielle sous la direction du Comité national des normes a annoncé que le chef du premier groupe de travail de normalisation des modèles à grande échelle de mon pays sera détenu conjointement par le Laboratoire d'intelligence artificielle de Shanghai et Baidu, Huawei, Ali et d'autres entreprises. Depuis, "l'équipe nationale" des grands modèles s'est constituée.
En fait, dès le mois de mai de cette année, le pays a commencé les travaux liés à la normalisation des grands modèles. Le groupe spécial nouvellement formé entreprendra la normalisation des grands modèles, dans le but de promouvoir la combinaison des grands modèles et des pratiques de normalisation. , et promouvoir le développement de l'industrie de l'intelligence artificielle croissance saine. Depuis lors, la piste de modélisme à grande échelle, bruyante depuis six mois, a officiellement annoncé qu'elle s'orienterait vers la normalisation.
Les géants "concourent", la compétition sur piste entre dans la bataille de grande dimension
Lors de la Conférence mondiale sur l'intelligence artificielle 2023, le grand modèle mérite d'être la "classe supérieure".
Baidu Wenxin, Ali Tongyi, Huawei Pangu, Xunfei Xinghuo, Shangtang Ririxin, Netease Fuxi et plus de 30 modèles à grande échelle ont tous été dévoilés. Sur le site de la conférence, les géants ont abandonné le concept les uns après les autres, se sont rapprochés et ont montré les réalisations de chaque entreprise.
Dans l'après-midi du 7 juillet, lors de la Huawei Developer Conference 2023 (Cloud), Zhang Pingan, directeur exécutif de Huawei et PDG de Huawei Cloud, a annoncé la sortie officielle du Huawei Cloud Pangu Model 3.0. Il a également déclaré que "le modèle Pangu de Huawei est très occupé, occupé par des choses et n'a pas le temps d'écrire des poèmes." Cette décision est également considérée comme impliquant que le modèle précédemment publié aime écrire des poèmes et de la prose lors de la conférence de presse. Parce que Huawei espère utiliser le grand modèle Pangu pour aider diverses industries, telles que la finance, les affaires gouvernementales, l'exploitation minière, la météorologie, etc., au lieu de se concentrer sur le niveau du grand modèle vocal.
On dit que jusqu'à présent, le grand modèle de Pangu a été mis en œuvre dans la météorologie, la recherche et le développement médicaux, l'énergie électrique, la langue et d'autres domaines, et a fourni plusieurs grands modèles avec des centaines de milliards de paramètres.
Zhou Jingren, CTO d'Alibaba Cloud, a déclaré que "l'objectif principal sera de promouvoir la prospérité de l'écologie modèle à grande échelle de la Chine et de fournir des services complets aux start-up à grande échelle". Évidemment, cela continue le concept MaaS (Model as a Service) proposé par Alibaba Cloud.
Baidu est l'un des premiers acteurs et son modèle à grande échelle Wenxin a toujours attiré l'attention de l'industrie. Lors de cette conférence, le directeur de la technologie de Baidu, Wang Haifeng, a déclaré que Baidu était désormais passé au modèle Wenxin 3.5. L'effet est augmenté de 50%, la vitesse d'entraînement est augmentée de 2 fois et la vitesse de raisonnement est augmentée de 30 fois.
En plus de l'actualité de "l'équipe nationale", de grandes sociétés Internet telles que Tencent accélèrent également le processus de grands modèles, du concept à la mise en œuvre.
Au cours des 20 derniers jours, les nouvelles lourdes de Tencent sur le grand modèle se sont fréquemment propagées. Le 19 juin, il a dévoilé publiquement ses réflexions sur les grands modèles pour la première fois. Le 26 juin, il a dévoilé pour la première fois le réseau informatique haute performance Xingmai développé par lui-même. Le 7 juillet, Wu Yunsheng, vice-président de Tencent Cloud et responsable de Tencent Cloud Intelligence, a annoncé qu'en termes d'innovation applicative, les capacités du modèle industriel à grande échelle de Tencent Cloud sont appliquées à des scénarios tels que le contrôle des risques financiers, la traduction interactive et le service client numérique intelligent, ce qui améliore l'efficacité des applications intelligentes.
** On peut voir qu'avec l'afflux rapide de fabricants, les modèles nationaux à grande échelle ont rapidement dépassé le stade du concept, et maintenant chaque entreprise se concentre sur la façon de mettre en œuvre et de commercialiser. **
Dans la guerre d'ascension qui a déjà commencé, le seuil a été relevé et la difficulté a augmenté. Ce n'est pas un petit défi pour n'importe quel fabricant.
Ouvrez le "volume" dans tous les sens pour saisir la bonne posture du "sol élevé" du grand modèle
En fait, bien que le grand modèle soit très populaire, il est assez difficile d'entrer dans le jeu pour réellement atterrir et le pousser sur le marché, et de nombreuses difficultés sont déjà apparues. Le financement, les talents, l'infrastructure, les scénarios et la commercialisation sont devenus une "course d'obstacles" que chaque joueur doit surmonter.
Au début du développement des grands modèles, certaines personnes de l'industrie ont déclaré que "les grands modèles sont le jeu des grands fabricants", ce qui implique que "les grands modèles sont très chers", et que seuls les grands fabricants peuvent se le permettre. Selon des statistiques incomplètes de Titanium Media, en 2022, Huawei investira 161,5 milliards de yuans dans les dépenses de R&D, devenant ainsi l'entreprise avec le plus d'investissements en R&D ; suivi de Tencent avec 61,4 milliards de yuans et Alibaba avec 55,5 milliards de yuans. Au cours des dix dernières années, Baidu a investi plus de 100 milliards de yuans dans le domaine de l'IA. L'investissement annuel en R&D par les principaux fabricants d'Internet leur a permis de disposer d'une solide équipe de R&D et de devenir un "premier échelon" bien mérité sur la piste des modèles à grande échelle.
Mais ils ne peuvent pas s'engager aveuglément sans rien attendre en retour. À en juger par la dynamique actuelle, ils accélèrent tous la mise en œuvre de l'industrie. Des fonds importants sont investis dans la recherche et le développement, commercialisés dès que possible, puis investis dans le développement et la formation de modèles d'IA - il s'agit d'un cycle qui soutient les acteurs du modèle à grande échelle.
Tout comme Li Qiang, vice-président de Tencent et président des activités gouvernementales et d'entreprise de Tencent, a déclaré : « À l'ère des grands modèles, les données, le réseau et la puissance de calcul constituent le « triangle de fer » de l'infrastructure sous-jacente. » Mais au En même temps, il a également déclaré: "Modèles pour les industries verticales, ce sera le point de basculement de la valeur des modèles à grande échelle." L'implication est que le capital et la technologie ne sont que les conditions et l'élan nécessaires pour entrer dans le modèle à grande échelle l'industrie, et le vrai point culminant est toujours au niveau du débarquement.
Le talent est une partie extrêmement importante de la compétition d'atterrissage de modèles réduits à grande échelle.
Au premier trimestre de cette année, diverses entreprises ont lancé une "guerre des talents". À cette époque, Wang Huiwen a exprimé sa volonté de prendre 75 % des actions pour inviter les meilleurs talents de R&D, et Li Kaifu a appelé au recrutement de talents de classe mondiale dans le monde entier. Baidu est prêt à recruter des ingénieurs en algorithmes de modèles à grande échelle d'IA avec un salaire mensuel de 25 à 40 000. Un salaire mensuel de 40 à 70 000 pour recruter des ingénieurs en formation de modèles et en algorithmes à grande échelle. Dans le même temps, sur un site Web de recrutement, le salaire des produits modèles à grande échelle et des postes d'exploitation a atteint un niveau de salaire mensuel de 35 à 60 000.
Deuxièmement, les « infrastructures » telles que les algorithmes, la puissance de calcul et les données sont toujours la priorité absolue du grand modèle. Selon l'évaluation de 10 grands modèles d'IA dans le pays et à l'étranger par les institutions compétentes, dans l'ensemble, les grands modèles nationaux surpassent les modèles étrangers en termes de compréhension des mots et de questions de connaissance, c'est-à-dire les grands modèles d'IA nationaux. [gf] 2f42[/gf]Cognition de base et capacité d'apprentissage des personnages [gf] 2f12[/gf] est plus fort. Mais en même temps, il convient également de noter qu'au niveau des données, le développement de grands modèles nécessite des ensembles de données de formation de haute qualité.
En termes de puissance de calcul, bien que certaines entreprises technologiques de premier plan telles qu'Ali, Baidu, Tencent et Huawei aient achevé la construction de centres de données dans mon pays, et que des acteurs dans des domaines verticaux tels que SenseTime et Megvii aient beaucoup investi, il reste encore un beaucoup de capacité Peu de place à l'amélioration.
Enfin, il y a les scénarios d'atterrissage et de commercialisation.
Le coût élevé de la commercialisation dans différents scénarios de subdivision et dans différentes industries est également un problème commun auquel l'industrie est confrontée. On estime que le coût de la formation d'un grand modèle se situe entre 2 et 12 millions de dollars US. Dans l'ensemble, la réalisation commerciale de grands modèles d'IA prendra du temps.
Les fabricants plus pragmatiques choisissent de se concentrer sur certains de leurs points forts. Par exemple, Tencent a pris l'initiative d'atterrir dans les domaines de la finance et de l'éducation, et le service MaaS à guichet unique a réduit la charge des entreprises ; après la mise à niveau du grand modèle de Baidu Wenxin, le coût a été réduit à 10 % du passé. Jusqu'à présent, Baidu Smart Cloud a obtenu de bons résultats de test dans plus de 400 scénarios avec plus de 300 partenaires écologiques. Huawei a commencé à travailler dur dans ses propres domaines gouvernementaux et d'entreprise...
On voit que cette grande bataille de modèles pour l'avenir bat son plein.
Écrivez à la fin
Dans le cadre de la "guerre des modèles de groupe", tout joueur doit saisir l'opportunité, et beaucoup de gens la considèrent comme un bonus de l'époque. C'est compréhensible, dans cette voie de plus en plus compétitive, même si les difficultés sont nombreuses, les modèles nationaux à grande échelle évoluent encore vers une direction technique et une commercialisation plus complètes et pragmatiques. ** Ce type de situation de concurrence dans l'industrie, animée et pratique, ne peut qu'accélérer le rythme de développement de la technologie des modèles à grande échelle de mon pays et promouvoir la mise à niveau technologique globale de l'industrie chinoise de l'IA. **
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
30 entreprises se disputent le WAIC : les grands modèles entrent dans la guerre des grandes dimensions
Source : Zero State LT, auteur : Zhuo Xinyue, éditeur : Hu Zhanjia
La Conférence mondiale sur l'intelligence artificielle 2023 (WAIC 2023), l'événement le plus accrocheur du cercle technologique ces derniers temps, a donné une réponse qui a choqué tout le monde : six mois ! Une demi-année n'est pas trop longue pour n'importe quelle piste technologique, et même certaines pistes n'en sont qu'au stade de "l'enfance", mais la piste modèle à grande échelle a achevé le processus du concept à la mise en œuvre en si peu de temps.
Au premier trimestre de cette année, l'industrie discutait encore de la question du "si oui ou non". Au deuxième trimestre, la tendance des différents grands fabricants à se regrouper pour fabriquer de grands modèles est que les acteurs répondent "comment faire". .
Cette réponse, en substance, a été concentrée par plus de 30 fabricants de modèles à grande échelle participant à la conférence WAIC - résoudre d'abord les problèmes techniques, suivis de la mise en œuvre de la scène, et enfin commerciaux et à grande échelle.
"Auparavant, les difficultés de mise en œuvre de l'intelligence artificielle se situaient davantage au niveau technique, comme dans le domaine de la conduite autonome. Elle est développée depuis de nombreuses années, mais la commercialisation empêche toujours les acteurs de voir l'aube." après avoir visité la conférence WAIC: "Relative Cependant, il convient de noter que la concurrence sur le marché des grands modèles sera plus intense."
Lors de cette conférence WAIC, plus de 30 entreprises se sont concentrées sur « montrer leurs muscles », y compris des géants tels que Baidu, Tencent, Ali, Huawei et JD.com, ainsi que des acteurs dans des domaines verticaux tels que SenseTime et NetEase.
À ce moment-là, on a appris que le chef du premier groupe de travail sur la normalisation des modèles à grande échelle de mon pays était détenu conjointement par le Laboratoire d'intelligence artificielle de Shanghai et Baidu, Huawei, Ali et d'autres sociétés. Ces premières sociétés présélectionnées ont également reçu le " Titre de l'équipe nationale". ** Il existe divers signes indiquant qu'une bataille PK modèle à grande échelle de plus grande dimension menée par "l'équipe nationale" a officiellement commencé. **
De "danse modèle de groupe" à "leader d'équipe nationale"
Depuis le début de cette année, les grands modèles sont sans aucun doute devenus le point le plus en vogue de la technologie et sont rapidement devenus le "thème principal" de diverses entreprises. Il semble qu'aucun grand constructeur n'ose dire publiquement qu'il ne sera pas impliqué là-dedans. Selon des statistiques incomplètes, au premier semestre de cette année, près d'une centaine d'entreprises ont officiellement annoncé la construction de modèles à grande échelle.
De grandes sociétés Internet telles qu'Ali, Baidu, Tencent, ByteDance et JD.com, des sociétés d'IA représentées par iFlytek et SenseTime, et diverses industries représentées par des sociétés éducatives telles que Kidswant et des sociétés financières telles que Huashun Companies sont entrées dans le jeu les unes après les autres. .
De plus, on assiste à une montée en puissance rapide dans le pays pour démarrer une entreprise de modèles à grande échelle d'IA.De nombreux géants de la technologie, cadres et anciens dirigeants de grands fabricants se sont consacrés aux modèles à grande échelle pour démarrer une nouvelle entreprise. Par exemple, Wang Huiwen, le co-fondateur du Meituan original, est entré dans le grand modèle d'IA avec un profil élevé (actuellement, "Light Years Beyond" établi par la société a été acquis par Meituan) ; Li Kaifu, Le PDG d'Innovation Works, Wang Xiaochuan, fondateur de Sohu, et l'ancien pionnier des affaires de JD.com AI Zhou Bowen et d'autres ont rejoint la vague entrepreneuriale des grands modèles d'IA. Bien que cette scène ne soit pas aussi spectaculaire que la "guerre des mille régiments" à l'époque, il suffit de surprendre le monde extérieur pour une piste de modèle à grande échelle qui nécessite des seuils techniques extrêmement élevés d'intelligence artificielle + solutions.
Ces dernières années, la voie vers B a été extrêmement chaude, et la demande de transformation numérique et de mise à niveau des entreprises est devenue de plus en plus forte, et la réduction des coûts et l'amélioration de l'efficacité sont également les principales exigences des entreprises. Même de nombreuses personnes dans l'industrie pensent que les modèles à grande échelle sont devenus le domaine le plus prometteur pour une croissance progressive dans le cercle technologique. Et cela est devenu l'une des raisons de la popularité rapide des grands modèles.
** Lors de la conférence WAIC qui s'est tenue à Shanghai du 6 au 8 juillet, plus de 30 entreprises de modèles à grande échelle ont concouru pour afficher la disposition et les réalisations au niveau des modèles à grande échelle, qui est également devenu un événement marquant dans le développement de l'industrie . **
Baidu, en tant que premier fabricant en Chine à annoncer l'intelligence artificielle All In, a démontré son style Wenxinyi, l'un des "trésors de l'hôtel de ville", lors de la conférence, permettant à tous ceux qui sont entrés dans le hall d'exposition de se rendre compte que tout le monde peut "P- image". Huawei a déplacé son Atlas 900 PoD A2 sur la scène pour montrer sa puissance de calcul de base du côté matériel ; lors du sous-forum Alibaba Cloud, la "Tongyi Family" a ajouté un modèle de peinture AI "Tongyi Wanxiang", qui est Ali Le troisième produit grand modèle annoncé dans trois mois.
L'engouement de l'industrie pour les grands modèles a accéléré la mise en place de "l'équipe nationale".
Le 7 juillet, lors de la conférence WACI 2023, la normalisation nationale de l'intelligence artificielle sous la direction du Comité national des normes a annoncé que le chef du premier groupe de travail de normalisation des modèles à grande échelle de mon pays sera détenu conjointement par le Laboratoire d'intelligence artificielle de Shanghai et Baidu, Huawei, Ali et d'autres entreprises. Depuis, "l'équipe nationale" des grands modèles s'est constituée.
En fait, dès le mois de mai de cette année, le pays a commencé les travaux liés à la normalisation des grands modèles. Le groupe spécial nouvellement formé entreprendra la normalisation des grands modèles, dans le but de promouvoir la combinaison des grands modèles et des pratiques de normalisation. , et promouvoir le développement de l'industrie de l'intelligence artificielle croissance saine. Depuis lors, la piste de modélisme à grande échelle, bruyante depuis six mois, a officiellement annoncé qu'elle s'orienterait vers la normalisation.
Les géants "concourent", la compétition sur piste entre dans la bataille de grande dimension
Lors de la Conférence mondiale sur l'intelligence artificielle 2023, le grand modèle mérite d'être la "classe supérieure".
Baidu Wenxin, Ali Tongyi, Huawei Pangu, Xunfei Xinghuo, Shangtang Ririxin, Netease Fuxi et plus de 30 modèles à grande échelle ont tous été dévoilés. Sur le site de la conférence, les géants ont abandonné le concept les uns après les autres, se sont rapprochés et ont montré les réalisations de chaque entreprise.
Dans l'après-midi du 7 juillet, lors de la Huawei Developer Conference 2023 (Cloud), Zhang Pingan, directeur exécutif de Huawei et PDG de Huawei Cloud, a annoncé la sortie officielle du Huawei Cloud Pangu Model 3.0. Il a également déclaré que "le modèle Pangu de Huawei est très occupé, occupé par des choses et n'a pas le temps d'écrire des poèmes." Cette décision est également considérée comme impliquant que le modèle précédemment publié aime écrire des poèmes et de la prose lors de la conférence de presse. Parce que Huawei espère utiliser le grand modèle Pangu pour aider diverses industries, telles que la finance, les affaires gouvernementales, l'exploitation minière, la météorologie, etc., au lieu de se concentrer sur le niveau du grand modèle vocal.
On dit que jusqu'à présent, le grand modèle de Pangu a été mis en œuvre dans la météorologie, la recherche et le développement médicaux, l'énergie électrique, la langue et d'autres domaines, et a fourni plusieurs grands modèles avec des centaines de milliards de paramètres.
Zhou Jingren, CTO d'Alibaba Cloud, a déclaré que "l'objectif principal sera de promouvoir la prospérité de l'écologie modèle à grande échelle de la Chine et de fournir des services complets aux start-up à grande échelle". Évidemment, cela continue le concept MaaS (Model as a Service) proposé par Alibaba Cloud.
Baidu est l'un des premiers acteurs et son modèle à grande échelle Wenxin a toujours attiré l'attention de l'industrie. Lors de cette conférence, le directeur de la technologie de Baidu, Wang Haifeng, a déclaré que Baidu était désormais passé au modèle Wenxin 3.5. L'effet est augmenté de 50%, la vitesse d'entraînement est augmentée de 2 fois et la vitesse de raisonnement est augmentée de 30 fois.
En plus de l'actualité de "l'équipe nationale", de grandes sociétés Internet telles que Tencent accélèrent également le processus de grands modèles, du concept à la mise en œuvre.
Au cours des 20 derniers jours, les nouvelles lourdes de Tencent sur le grand modèle se sont fréquemment propagées. Le 19 juin, il a dévoilé publiquement ses réflexions sur les grands modèles pour la première fois. Le 26 juin, il a dévoilé pour la première fois le réseau informatique haute performance Xingmai développé par lui-même. Le 7 juillet, Wu Yunsheng, vice-président de Tencent Cloud et responsable de Tencent Cloud Intelligence, a annoncé qu'en termes d'innovation applicative, les capacités du modèle industriel à grande échelle de Tencent Cloud sont appliquées à des scénarios tels que le contrôle des risques financiers, la traduction interactive et le service client numérique intelligent, ce qui améliore l'efficacité des applications intelligentes.
** On peut voir qu'avec l'afflux rapide de fabricants, les modèles nationaux à grande échelle ont rapidement dépassé le stade du concept, et maintenant chaque entreprise se concentre sur la façon de mettre en œuvre et de commercialiser. **
Dans la guerre d'ascension qui a déjà commencé, le seuil a été relevé et la difficulté a augmenté. Ce n'est pas un petit défi pour n'importe quel fabricant.
Ouvrez le "volume" dans tous les sens pour saisir la bonne posture du "sol élevé" du grand modèle
En fait, bien que le grand modèle soit très populaire, il est assez difficile d'entrer dans le jeu pour réellement atterrir et le pousser sur le marché, et de nombreuses difficultés sont déjà apparues. Le financement, les talents, l'infrastructure, les scénarios et la commercialisation sont devenus une "course d'obstacles" que chaque joueur doit surmonter.
Au début du développement des grands modèles, certaines personnes de l'industrie ont déclaré que "les grands modèles sont le jeu des grands fabricants", ce qui implique que "les grands modèles sont très chers", et que seuls les grands fabricants peuvent se le permettre. Selon des statistiques incomplètes de Titanium Media, en 2022, Huawei investira 161,5 milliards de yuans dans les dépenses de R&D, devenant ainsi l'entreprise avec le plus d'investissements en R&D ; suivi de Tencent avec 61,4 milliards de yuans et Alibaba avec 55,5 milliards de yuans. Au cours des dix dernières années, Baidu a investi plus de 100 milliards de yuans dans le domaine de l'IA. L'investissement annuel en R&D par les principaux fabricants d'Internet leur a permis de disposer d'une solide équipe de R&D et de devenir un "premier échelon" bien mérité sur la piste des modèles à grande échelle.
Mais ils ne peuvent pas s'engager aveuglément sans rien attendre en retour. À en juger par la dynamique actuelle, ils accélèrent tous la mise en œuvre de l'industrie. Des fonds importants sont investis dans la recherche et le développement, commercialisés dès que possible, puis investis dans le développement et la formation de modèles d'IA - il s'agit d'un cycle qui soutient les acteurs du modèle à grande échelle.
Tout comme Li Qiang, vice-président de Tencent et président des activités gouvernementales et d'entreprise de Tencent, a déclaré : « À l'ère des grands modèles, les données, le réseau et la puissance de calcul constituent le « triangle de fer » de l'infrastructure sous-jacente. » Mais au En même temps, il a également déclaré: "Modèles pour les industries verticales, ce sera le point de basculement de la valeur des modèles à grande échelle." L'implication est que le capital et la technologie ne sont que les conditions et l'élan nécessaires pour entrer dans le modèle à grande échelle l'industrie, et le vrai point culminant est toujours au niveau du débarquement.
Le talent est une partie extrêmement importante de la compétition d'atterrissage de modèles réduits à grande échelle.
Au premier trimestre de cette année, diverses entreprises ont lancé une "guerre des talents". À cette époque, Wang Huiwen a exprimé sa volonté de prendre 75 % des actions pour inviter les meilleurs talents de R&D, et Li Kaifu a appelé au recrutement de talents de classe mondiale dans le monde entier. Baidu est prêt à recruter des ingénieurs en algorithmes de modèles à grande échelle d'IA avec un salaire mensuel de 25 à 40 000. Un salaire mensuel de 40 à 70 000 pour recruter des ingénieurs en formation de modèles et en algorithmes à grande échelle. Dans le même temps, sur un site Web de recrutement, le salaire des produits modèles à grande échelle et des postes d'exploitation a atteint un niveau de salaire mensuel de 35 à 60 000.
Deuxièmement, les « infrastructures » telles que les algorithmes, la puissance de calcul et les données sont toujours la priorité absolue du grand modèle. Selon l'évaluation de 10 grands modèles d'IA dans le pays et à l'étranger par les institutions compétentes, dans l'ensemble, les grands modèles nationaux surpassent les modèles étrangers en termes de compréhension des mots et de questions de connaissance, c'est-à-dire les grands modèles d'IA nationaux. [gf] 2f42[/gf]Cognition de base et capacité d'apprentissage des personnages [gf] 2f12[/gf] est plus fort. Mais en même temps, il convient également de noter qu'au niveau des données, le développement de grands modèles nécessite des ensembles de données de formation de haute qualité.
En termes de puissance de calcul, bien que certaines entreprises technologiques de premier plan telles qu'Ali, Baidu, Tencent et Huawei aient achevé la construction de centres de données dans mon pays, et que des acteurs dans des domaines verticaux tels que SenseTime et Megvii aient beaucoup investi, il reste encore un beaucoup de capacité Peu de place à l'amélioration.
Enfin, il y a les scénarios d'atterrissage et de commercialisation.
Le coût élevé de la commercialisation dans différents scénarios de subdivision et dans différentes industries est également un problème commun auquel l'industrie est confrontée. On estime que le coût de la formation d'un grand modèle se situe entre 2 et 12 millions de dollars US. Dans l'ensemble, la réalisation commerciale de grands modèles d'IA prendra du temps.
Les fabricants plus pragmatiques choisissent de se concentrer sur certains de leurs points forts. Par exemple, Tencent a pris l'initiative d'atterrir dans les domaines de la finance et de l'éducation, et le service MaaS à guichet unique a réduit la charge des entreprises ; après la mise à niveau du grand modèle de Baidu Wenxin, le coût a été réduit à 10 % du passé. Jusqu'à présent, Baidu Smart Cloud a obtenu de bons résultats de test dans plus de 400 scénarios avec plus de 300 partenaires écologiques. Huawei a commencé à travailler dur dans ses propres domaines gouvernementaux et d'entreprise...
On voit que cette grande bataille de modèles pour l'avenir bat son plein.
Écrivez à la fin
Dans le cadre de la "guerre des modèles de groupe", tout joueur doit saisir l'opportunité, et beaucoup de gens la considèrent comme un bonus de l'époque. C'est compréhensible, dans cette voie de plus en plus compétitive, même si les difficultés sont nombreuses, les modèles nationaux à grande échelle évoluent encore vers une direction technique et une commercialisation plus complètes et pragmatiques. ** Ce type de situation de concurrence dans l'industrie, animée et pratique, ne peut qu'accélérer le rythme de développement de la technologie des modèles à grande échelle de mon pays et promouvoir la mise à niveau technologique globale de l'industrie chinoise de l'IA. **