Huawei a montré ses "muscles" dans le domaine des grands modèles.
Le 7 juillet, la conférence des développeurs Huawei 2023 (HDC 2023) s'est ouverte. Dans le discours d'ouverture de plus de deux heures de l'après-midi, HUAWEI CLOUD a dévoilé pour la première fois en détail les progrès du grand modèle Pangu.Il a non seulement publié le grand modèle 3.0 Pangu orienté vers l'industrie, mais a également présenté en détail les bases capacités techniques de Huawei pour développer de grands modèles.
Le Pangu Large Model 3.0 comprend une structure à trois niveaux "5 + N + X". Les trois couches font référence aux cinq grands modèles de base de la couche L0, aux N grands modèles à l'échelle de l'industrie de la couche L1 et à la couche L2. qui permet aux utilisateurs de former indépendamment plus Affiner le modèle de scène. Il adopte une conception de découplage en couches complète, et les utilisateurs de l'entreprise peuvent choisir un développement, une mise à niveau ou un réglage fin du modèle à grande échelle approprié en fonction de leurs propres besoins commerciaux, afin de s'adapter aux besoins changeants de milliers d'industries.
Hu Houkun, président tournant de Huawei, a déclaré lors de la récente conférence WAIC que le cœur du modèle de développement de Huawei est de se concentrer sur la puissance de calcul et les applications**. D'une part, il s'agit d'approfondir la puissance de calcul et de construire une base de puissance de calcul solide pour soutenir le développement de l'industrie chinoise de l'intelligence artificielle. D'autre part, il s'agit de combiner des modèles à grande échelle, des modèles à grande échelle à usage général à la recherche et à l'innovation à grande échelle à l'échelle de l'industrie, pour vraiment faire en sorte que l'intelligence artificielle serve bien des milliers d'industries et de recherche scientifique.
Huawei est l'un des premiers fournisseurs de services cloud en Chine à déployer des modèles à grande échelle et a publié le modèle à grande échelle Pangu dès 2021. Sur la voie du développement de modèles à grande échelle, Huawei a construit une plate-forme cloud de puissance de calcul d'IA basée sur Kunpeng et Ascend à partir de la couche inférieure, ainsi que des capacités techniques telles que l'architecture informatique hétérogène CANN, le cadre d'IA à scénario complet MindSpore, et la ligne de production de développement d'IA ModelArts. .
En plus du grand modèle et de la base de puissance de calcul, lors de la réunion, HUAWEI CLOUD a également mis en évidence des cas typiques de combinaison du grand modèle Pangu et d'industries spécifiques.Les industries concernées comprennent les affaires gouvernementales, la météorologie, les chemins de fer, la fabrication et la finance, ainsi que ainsi que de multiples mises à niveau et remodelage de Huawei Cas d'application de produits et services logiciels cloud.
Qu'il s'agisse de capacités techniques de base, d'un système de service de produit cloud AI**+ ou de cas d'application dans des secteurs spécifiques, HUAWEI CLOUD a démontré des capacités commerciales hautement matures et systématiques, ce qui impressionne vraiment l'industrie. ** Alors que tout le monde se dispute encore pour savoir qui est l'OpenAI chinois, HUAWEI CLOUD a ouvert une voie de développement assez mature pour les modèles à grande échelle.
Huawei utilise sa propre pratique pour prouver que les modèles à grande échelle sont importants, mais plus important encore, il s'agit d'utiliser des modèles à grande échelle pour résoudre les problèmes des industries et des produits, pour produire des produits et des services qui peuvent faire payer les entreprises et les utilisateurs , et de créer véritablement de la valeur pour des milliers d'industries.
01 Pangu Large Model 3.0 : architecture de découplage en couches
Le découplage est le mot clé du modèle Pangu 3.0 publié aujourd'hui. C'est également un appel commun des clients de l'industrie qui ont en fait invoqué de grands modèles au cours des derniers mois.
Un fournisseur SaaS de premier plan a déclaré lors de la sortie de sa propre application de mise à niveau de modèle à grande échelle : "Nous ne développons pas de modèles à grande échelle par nous-mêmes, mais dans différents scénarios commerciaux, quel modèle à grande échelle est bon pour quoi, nous prenons ce modèle." Afin de pouvoir basculer entre différents grands modèles, "notre propre architecture de produit doit être indépendante du grand modèle sous-jacent, ou faiblement couplée."
"La conception de découplage du grand modèle de Pangu est dans l'intérêt de l'industrie." Lors de la conférence des développeurs Huawei, Zhang Pingan, directeur exécutif de Huawei et PDG de Huawei Cloud, a donné l'itinéraire différencié du grand modèle de Pangu. Son cœur est de découpler les différentes couches et capacités du modèle Pangu, permettant aux utilisateurs de l'industrie de se développer en fonction de leurs propres besoins.
Plus précisément, Pangu Large-scale Model 3.0 est une série de modèles à grande échelle orientée vers l'industrie, comprenant une structure à trois niveaux "5 + N + X":
« 5 » représente les cinq grands modèles de base de la couche L0 : y compris les grands modèles de langage naturel, de vision, multimodaux, de prévision et de calcul scientifique, qui fournissent et répondent aux besoins de diverses compétences dans des scénarios industriels.
Pangu 3.0 fournit aux clients de grands modèles de base sérialisés avec 10 milliards de paramètres, 38 milliards de paramètres, 71 milliards de paramètres et 100 milliards de paramètres, correspondant aux besoins diversifiés des clients dans différents scénarios, différents retards et différentes vitesses de réponse. En même temps, il fournit un nouvel ensemble de fonctionnalités, y compris la réponse aux questions de connaissances, la génération de copie et la génération de code pour les grands modèles NLP, ainsi que la génération et la compréhension d'images pour les grands modèles multimodaux.Ces compétences peuvent être directement utilisées par les clients et les entreprises partenaires. Quelle que soit la taille du grand modèle, Pangu fournit un ensemble cohérent de fonctionnalités.
Le "N" dans la structure à trois niveaux "5+N+X" représente N grands modèles industriels au niveau L1. Il existe deux façons de fournir de grands modèles industriels : d'une part, HUAWEI CLOUD peut fournir de grands modèles industriels généraux formés à l'aide de données publiques de l'industrie, y compris les affaires gouvernementales, la finance, la fabrication, l'exploitation minière, la météo et d'autres grands modèles ; d'autre part, il peut être basé sur des clients de l'industrie Avec ses propres données, sur les couches L0 et L1 du grand modèle Pangea, il forme son propre grand modèle propriétaire pour les clients.
Zhang Pingan a déclaré : « Pangu est né pour servir l'industrie, et il fournit une variété de formes de déploiement, de développement et de raisonnement de modèles à grande échelle. Il peut générer son propre modèle industriel à grande échelle, tout comme le modèle à grande échelle de Pangu de Huawei. , et n'a besoin d'entrer que ses propres données privées. ." De plus, les données de formation sont également découplées du grand modèle.
Le X dans "5+N+X" signifie que la couche L2 fournit aux clients des modèles de scènes plus détaillés, se concentrant davantage sur les lignes directes des affaires gouvernementales, les assistants réseau, le dépistage de drogue, la détection de corps étrangers sur les tapis roulants et le typhon Paths Fournissez aux clients des services modèles « prêts à l'emploi » pour des applications sectorielles spécifiques ou des scénarios commerciaux spécifiques tels que les prévisions.
Grâce au grand modèle à trois couches de "** 5 + N + X", HUAWEI CLOUD a construit sa propre grande base de modèles.
Lors de la conférence mondiale sur l'intelligence artificielle d'hier, Hu Houkun, le président tournant de Huawei, a expliqué de manière éclatante : "Le niveau le plus élémentaire d'analyse comparative est le modèle général à grande échelle, que nous appelons le modèle de base à grande échelle. Notre image à ce niveau s'appelle la lecture des milliers de livres, ce qui est de bien faire. Une grande quantité de connaissances de base est apprise. Sur cette couche, des modèles industriels et des modèles de scène sont également créés, appelés parcourant des milliers de kilomètres. Il reste encore de nombreux défis à surmonter en lisant des milliers de livres. à parcourir des milliers de kilomètres. Le point clé est que Huawei travaille avec des partenaires de diverses industries pour faire correspondre et intégrer pleinement les connaissances de diverses industries avec de grands modèles.
** De plus, l'innovation du grand modèle n'est pas seulement l'innovation du modèle lui-même, mais dépend également de l'innovation de diverses technologies racines de l'IA. Lors de la réunion, Yao Jun, directeur du laboratoire de l'arche de Noé de Huawei, a présenté la base technique du modèle Pangu.
Huawei a construit une plate-forme cloud de puissance de calcul d'IA basée sur Kunpeng et Ascend à la couche inférieure, ainsi que l'architecture informatique hétérogène CANN, le cadre d'IA à scénario complet MindSpore et la ligne de production de développement d'IA ModelArts, etc., pour fournir des solutions distribuées pour le développement et l'exploitation de grands modèles.Capacités clés telles que l'accélération parallèle, l'optimisation de l'opérateur et de la compilation et l'optimisation de la communication au niveau du cluster. Sur la base de la technologie racine AI de Huawei, les performances de la formation de grands modèles peuvent être ajustées à 1,1 fois celles des GPU traditionnels du secteur.
La puissance de calcul est la base de la formation de grands modèles. Lors de cette conférence, Zhang Ping'an a annoncé que le service cloud Ascend AI avec une seule puissance de calcul 2000P Flops sera lancé simultanément dans les centres de puissance informatique Ulanqab et Gui'an AI de Huawei Cloud. En plus de prendre en charge le cadre d'IA tous scénarios de Huawei, Shengsi MindSpore, Shengteng AI Cloud Service prend également en charge les cadres d'IA courants tels que Pytorch et Tensorflow.
Dans le même temps, 90 % des opérateurs de ces cadres peuvent être migrés en douceur vers la plate-forme Ascend via l'outil de migration de bout en bout de Huawei. Par exemple, Meitu a migré 70 modèles vers Ascend en seulement 30 jours. Dans le même temps, HUAWEI CLOUD et l'équipe Meitu ont optimisé conjointement plus de 30 opérateurs et accéléré le processus en parallèle. Par rapport à la solution d'origine, les performances de l'IA ont été amélioré de 30 %.
De plus, les pannes de GPU sont souvent rencontrées lors de la formation de grands modèles, et les développeurs doivent fréquemment redémarrer la formation, ce qui prend beaucoup de temps et coûte cher. Le service cloud Ascend AI peut fournir un service informatique AI plus stable.Le taux de stabilité à long terme de la formation de kilocalorie de 30 jours atteint 90% et le temps de récupération du point d'arrêt ne dépasse pas 10 minutes.
02 Autonomisez des milliers d'industries
Ren Zhengfei a précédemment déclaré: "La contribution directe des sociétés de plates-formes logicielles d'intelligence artificielle à la société humaine peut être inférieure à 2%, et 98% est la promotion de la société industrielle et de la société agricole. Mais la plate-forme d'application n'est pas notre option, nous serons la couche inférieure de la plate-forme de puissance AI Computing."
Laisser de grands modèles dans des milliers d'industries est devenu le centre du développement de grands modèles de Huawei. Lors de la réunion, HUAWEI CLOUD a présenté les cas d'application du grand modèle Pangu dans sept domaines, notamment les affaires gouvernementales, les chemins de fer, la météorologie et les finances.
Affaires du gouvernement
Dans le domaine des affaires gouvernementales, HUAWEI CLOUD et le Bureau de gestion des données des services gouvernementaux du district de Shenzhen Futian ont lancé Xiaofu, l'assistant intelligent des affaires gouvernementales de Futian basé sur le modèle des affaires gouvernementales de Pangu, qui peut comprendre avec précision les intentions de consultation des gens et changer le service traditionnel à guichet unique. modèle. En affinant plus de 200 000 données sur les affaires gouvernementales, y compris 12 345 lignes directes, des documents politiques, une encyclopédie des affaires gouvernementales, etc., les assistants aux affaires gouvernementales ont maîtrisé une mine de connaissances de l'industrie telles que les lois et réglementations et les procédures de traitement.
Selon Huawei Cloud, le cœur du grand modèle d'affaires gouvernementales de Pangu est la capacité cognitive. Laissez le système public urbain être vu et compris, et complétez la boucle fermée de la perception à la cognition et à l'élimination. Et selon différents scénarios, il offre différentes capacités telles que la réponse aux questions, la génération de copie, la perception vidéo et la compréhension multimodale.
HUAWEI CLOUD a présenté deux scénarios typiques : le premier est un scénario de conseil, où les utilisateurs de l'entreprise consultent les assistants gouvernementaux sur les politiques de soutien à l'investissement pertinentes, et les assistants gouvernementaux peuvent introduire des réglementations et des politiques pertinentes et fournir des suggestions appropriées aux consultants ; le deuxième scénario, Comme indiqué dans la figure ci-dessus, il s'agit d'une scène de traitement des affaires gouvernementales basée sur le dialogue et les capacités multimodales.Le personnel peut analyser intelligemment les violations dans les images en fonction des images prises par la caméra.
chemin de fer
Dans le domaine ferroviaire, Huawei a démontré le cas d'application de l'assistant d'inspection de camions.
Les inspecteurs de train traditionnels doivent inspecter chaque jour des millions de photos de trains pour détecter s'il y a des défauts dans les wagons de marchandises circulant sur le réseau ferroviaire. Après l'introduction du grand modèle Pangu, il peut identifier avec précision 67 types de camions fonctionnant sur le réseau en direct et plus de 430 types de défauts, et le taux de dépistage des images non défectueuses atteint 95 %. En d'autres termes, les inspecteurs de train n'ont besoin de détecter que 1/20 des images de train dans le passé, ce qui équivaut à une augmentation de 20 fois de l'efficacité du travail.
mine de charbon
Dans le domaine des mines de charbon, le modèle à grande échelle de la mine de Pangu a été utilisé dans 8 mines à travers le pays. Un grand modèle peut couvrir plus de 1 000 scénarios subdivisés dans des processus commerciaux tels que l'exploitation minière, l'excavation, les machines, le transport, le transport, et le lavage des mines de charbon, permettant à plus de mineurs de charbon de travailler sur le terrain, ce qui non seulement rend l'environnement de travail des mineurs de charbon plus confortable, mais réduit également considérablement les accidents de sécurité.
météorologique
Le domaine météorologique était au centre de la conférence de presse Huawei Cloud.Il y a quelques jours à peine, les résultats de la recherche du grand modèle météorologique de Pangu ont été publiés dans la revue étrangère de premier plan "Nature", et les critiques ont commenté : avenir de la prévision météorologique.
A l'origine, pour prédire la trajectoire d'un typhon dans les 10 prochains jours, il fallait 5 heures de simulation sur un cluster informatique performant de 3 000 serveurs. Désormais basé sur le grand modèle météorologique Pangea pré-formé, grâce au raisonnement de l'IA, les chercheurs n'ont besoin de configurer qu'une seule carte sur un seul serveur et peuvent obtenir des résultats de prédiction plus précis en 10 secondes.
À l'heure actuelle, le grand modèle météorologique Pangea peut être utilisé pour prédire les conditions météorologiques telles que les vagues, les températures élevées, les typhons et les vagues de froid. Par rapport aux prévisions météorologiques traditionnelles, il est plus rapide et plus précis. Auparavant, Pangu a coopéré avec le Bureau météorologique pour prédire le chemin de "Mawa" 10 jours à l'avance. En outre, Pangu a également prédit l'arrivée de la vague de froid en Finlande deux jours à l'avance, par rapport aux prévisions de l'Agence météorologique européenne. Les prévisions de Pangu sont également plus proches de la température réelle,
finance
Dans le domaine de la finance, Pangu Large Model a coopéré avec ICBC pour créer une série d'applications exploratoires.
L'un des scénarios typiques consiste à améliorer l'efficacité du travail des caissiers de banque. ICBC compte des dizaines de milliers de points de vente à travers le pays et 200 000 caissiers. Ils doivent basculer entre différents services, ce qui leur fera perdre beaucoup de temps.
Le grand modèle financier de Pangu pré-forme diverses opérations bancaires, politiques et documents de cas, et peut générer automatiquement des procédures et des conseils opérationnels pour le personnel de guichet en fonction des problèmes des clients, réduisant ainsi l'opération moyenne qui nécessitait à l'origine 5 opérations à 1. Temps de nœud raccourci de plus de 5 minutes.
Et ce n'est que l'application la plus basique.Huawei explore avec le secteur financier pour appliquer le grand modèle à des scénarios plus financiers tels que l'analyse de crédit à l'avenir.
fabrication
Huawei elle-même est également une entreprise de fabrication.Les produits matériels qu'elle fabrique comprennent des stations de base de communication, des téléphones portables, des automobiles, des puces et d'autres domaines. Sur la base de l'expérience accumulée dans le passé, Huawei a introduit le grand modèle Pangu dans le domaine de la production et de la fabrication.
Dans le passé, il fallait souvent plus de 3 heures pour faire un plan de production d'une journée pour une seule ligne de production pour faire un plan d'allocation des appareils. Après avoir appris les différentes données de l'appareil, les processus commerciaux et les règles de la chaîne de production de Huawei, le grand modèle de fabrication de Pangu peut comprendre avec précision les besoins de l'entreprise et appeler le plug-in Tianchou AI solver pour réaliser les 3 prochains jours en une minute Plan de production.
Découverte de médicament
Dans le domaine de la recherche et du développement de médicaments, la recherche initiale et le développement d'un nouveau médicament prennent en moyenne 10 ans et coûtent 1 milliard de dollars américains. Le grand modèle moléculaire des médicaments Pangu a aidé l'équipe du professeur Liu Bing du premier hôpital affilié de l'Université Xi'an Jiaotong à découvrir la première nouvelle cible et la nouvelle classe d'antibiotiques au monde en 40 ans, et à raccourcir le cycle de développement du médicament principal à un mois et réduire le coût de développement de 70%.
03 Grand modèle intégré au système de produit Huawei Cloud
En plus de la pratique dans des milliers d'industries, le modèle HUAWEI CLOUD Pangu a également été profondément intégré dans les services produits de HUAWEI CLOUD pour restructurer l'innovation des produits.
Grand Modèle Pangu + Service Cloud Huawei
Avec la bénédiction du modèle Pangu, une série de produits et services B-end de Huawei Cloud ont été mis à niveau et reconstruits. Lors de la réunion, HUAWEI CLOUD a présenté les détails de quatre mises à niveau de service : service de données, service client cloud, BI et recherche cloud.
* Dans le service de données, grâce à la technologie de rédaction et de génération de code du grand modèle Pangu, l'efficacité de l'écriture de données et de l'écriture de code frontal peut être améliorée, et le nouveau cycle de lancement de produit peut être considérablement raccourci.
Dans le service client cloud, grâce au dialogue Q&A intégré dans la base de connaissances de l'industrie et à la capacité d'exploration d'intention, l'ensemble du processus de réponse prioritaire de l'IA est réalisé et l'efficacité du service client est améliorée de 30 %.
En BI, grâce au routage intelligent NL2SQL et AutoGraph, la recommandation automatique de SQL aux graphiques visuels est réalisée, et grâce à plusieurs cycles d'interaction en langage naturel, tout le monde peut facilement obtenir un aperçu des détails commerciaux à partir des données.
Dans la recherche dans le cloud, grâce à l'intégration multimodale et à la technologie NL2API, il réalise des recherches de vidéos, de textes, de cartes et d'autres scènes de grande envergure. Grâce à de puissantes capacités de compréhension sémantique et de généralisation, le taux de précision de la recherche est augmenté de 15 %.
** Grand modèle Pangu + outil de code CodeArts **
HUAWEI CLOUD combine les outils de R&D CodeArts avec le grand modèle Pangu et a officiellement lancé CodeArts Snap, un assistant de programmation intelligent pour les développeurs.
L'outil a formé 76 milliards de lignes de codes sélectionnés et 13 millions de documents techniques. Il a trois fonctions principales de génération intelligente, de questions et réponses intelligentes et de collaboration intelligente. Il peut réaliser la génération de code en une phrase de dialogue, l'annotation automatique et la génération de cas de test en un clic Une commande peut être déployée intelligemment, de sorte que chaque développeur de logiciel dispose de son propre assistant de programmation.
Pangu Grand Modèle + Digital Man
HUAWEI CLOUD habilite la ligne de production de contenu numérique MetaStudio via le grand modèle de base Pangu, crée le modèle Pangu Digital Human Congress, fournit deux services majeurs de génération de modèle et de pilotage de modèle, et a utilisé 200 000 heures de données audio et vidéo pour la pré-formation.
Sur la base de ces deux services majeurs, les développeurs peuvent rapidement générer et piloter des modèles humains numériques, permettant l'éducation en ligne, la diffusion en direct de divertissement, les conférences d'entreprise et d'autres applications de l'industrie, afin que chaque employé de l'entreprise puisse réaliser la "liberté humaine numérique". Par exemple, les utilisateurs n'ont qu'à télécharger une vidéo personnelle de 20 secondes sur la page de service de HUAWEI CLOUD MetaStudio pour générer rapidement une vidéo d'explication humaine numérique personnalisée.Le travail effectué par trois membres du personnel de R&D en trois jours dans le passé peut désormais être terminé en seulement trois minutes.
Pangu Grand Modèle + Intelligence Incarnée
Lors de la réunion, Huawei Cloud a également mentionné l'application du modèle Pangu dans le domaine de la robotique et a présenté une vidéo.
Dans le passé, donner des commandes aux robots obligeait les développeurs à programmer, mais sur la base de la capacité de compréhension du langage naturel du modèle Pangu, les robots peuvent reconnaître le langage naturel, exécuter des commandes et disposer d'une intelligence autonome guidée par la perception globale. Lors de la réunion, Huawei a présenté une vidéo dans laquelle les utilisateurs n'ont pas besoin d'entrer des commandes de programme, mais seulement de donner des ordres au robot en langage naturel, et le robot peut exécuter des commandes telles que ramasser des objets, et fera des jugements autonomes basés sur sur l'environnement dans le processus (comme déplacer Ouvrir les articles divers qui bloquent l'objet cible) pour terminer la tâche.
Selon Huawei, la démonstration ci-dessus n'est pas une vidéo conceptuelle, mais un produit réel, qui a été exposé sur place lors de la conférence HDC.
**04 Synthèse et réflexion : Huawei peut-il devenir l'autre pôle de l'IA ? **
Zhang Pingan a déclaré : "Afin d'aider les clients, partenaires et développeurs mondiaux à former et à utiliser de grands modèles, nous nous engageons à créer un monde pour les clients mondiauxIA **Un autre pôle, fournissant de nouveaux développeurs d'IA s Choix". **
Même plus tôt, dès mars de cette année, Ren Zhengfei avait exprimé une signification similaire au sein de l'entreprise. Il a déclaré qu'il y aurait une augmentation des modèles d'IA, pas seulement de Microsoft. La raison de Ren Zhengfei est en fait la direction des efforts de Huawei Cloud aujourd'hui, c'est-à-dire que la contribution directe des sociétés de plateformes logicielles d'intelligence artificielle à la société humaine peut être inférieure à 2 %, et 98 % est la promotion de la société industrielle et de la société agricole.
Par exemple, des usines en Chine et en Allemagne encouragent la promotion de l'intelligence artificielle dans l'industrie, afin de réaliser une production sans personnel ; par exemple, le quai du port de Tianjin a également essayé le chargement et le déchargement de marchandises sans personnel. Une fois le code saisi, le le conteneur sera automatiquement retiré du navire. Transportez-le puis transportez-le en voiture ; par exemple, dans la mine de charbon du Shanxi, après l'adoption de l'intelligence artificielle 5G+ sous terre, le nombre de personnel a été réduit de 60 à 70 %, et la plupart des gens travaillent en costume dans la salle de contrôle au sol.
Ce sont des exemples où l'IA a été appliquée à grande échelle au côté industriel au cours des dernières années.Ce que ces industries ont en commun, c'est qu'elles ont une échelle et une valeur de production énormes, et une petite amélioration de l'efficacité peut apporter d'énormes avantages.
** L'émergence de grands modèles fournit essentiellement des outils de productivité plus efficaces. ** D'une part, pour ces industries qui adoptent déjà l'IA, cela signifie une plus grande efficacité et un processus de transformation plus rapide ; et une plus grande efficacité signifie également qu'il est plus facile pour un plus grand nombre d'industries de calculer le "compte économique" ", l'IA a le potentiel passer de quelques soi-disant grandes industries à la transformation de milliers d'industries.
C'est la raison pour laquelle Huawei entre résolument dans l'industrie.En fait, les principales sociétés nationales de services cloud telles que Alibaba Cloud, Tencent Cloud, Volcano Cloud et Baidu Cloud ont des idées similaires. Dans le cas d'une même direction et d'un point de départ proche, qui peut courir le plus rapidement dans cette compétition, c'est toute la capacité de la chaîne, de la puissance de calcul, de la grande base de modèles, de la plate-forme, des produits aux solutions spécifiques.
Pour des raisons bien connues, Huawei ne peut pas obtenir la puce informatique la plus avancée au monde, qui est actuellement reconnue, et il semble qu'elle soit intrinsèquement insuffisante dans cette compétition. Mais à en juger par la conférence de presse d'aujourd'hui, Huawei ne voit pas qu'il est à la traîne en raison des contraintes du haut de gamme.Dans le porte-clés du grand modèle, il a proposé des produits et des étuis matures, et le grand Pangu découplé l'architecture du modèle est encore plus C'est accrocheur. ** En fait, compte tenu des besoins de localisation aujourd'hui, Huawei, qui n'est pas en reste en termes de puissance de calcul, est susceptible de devenir un avantage indépendant et contrôlable. **
Les grands modèles sont devenus une nouvelle opportunité pour Huawei, et il semble que cela devienne une réalité.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Explication détaillée en 6000 mots du modèle Pangu : peut-il prendre en charge l'autre pôle de l'IA mondiale ?
Huawei a montré ses "muscles" dans le domaine des grands modèles.
Le 7 juillet, la conférence des développeurs Huawei 2023 (HDC 2023) s'est ouverte. Dans le discours d'ouverture de plus de deux heures de l'après-midi, HUAWEI CLOUD a dévoilé pour la première fois en détail les progrès du grand modèle Pangu.Il a non seulement publié le grand modèle 3.0 Pangu orienté vers l'industrie, mais a également présenté en détail les bases capacités techniques de Huawei pour développer de grands modèles.
Le Pangu Large Model 3.0 comprend une structure à trois niveaux "5 + N + X". Les trois couches font référence aux cinq grands modèles de base de la couche L0, aux N grands modèles à l'échelle de l'industrie de la couche L1 et à la couche L2. qui permet aux utilisateurs de former indépendamment plus Affiner le modèle de scène. Il adopte une conception de découplage en couches complète, et les utilisateurs de l'entreprise peuvent choisir un développement, une mise à niveau ou un réglage fin du modèle à grande échelle approprié en fonction de leurs propres besoins commerciaux, afin de s'adapter aux besoins changeants de milliers d'industries.
Huawei est l'un des premiers fournisseurs de services cloud en Chine à déployer des modèles à grande échelle et a publié le modèle à grande échelle Pangu dès 2021. Sur la voie du développement de modèles à grande échelle, Huawei a construit une plate-forme cloud de puissance de calcul d'IA basée sur Kunpeng et Ascend à partir de la couche inférieure, ainsi que des capacités techniques telles que l'architecture informatique hétérogène CANN, le cadre d'IA à scénario complet MindSpore, et la ligne de production de développement d'IA ModelArts. .
En plus du grand modèle et de la base de puissance de calcul, lors de la réunion, HUAWEI CLOUD a également mis en évidence des cas typiques de combinaison du grand modèle Pangu et d'industries spécifiques.Les industries concernées comprennent les affaires gouvernementales, la météorologie, les chemins de fer, la fabrication et la finance, ainsi que ainsi que de multiples mises à niveau et remodelage de Huawei Cas d'application de produits et services logiciels cloud.
Qu'il s'agisse de capacités techniques de base, d'un système de service de produit cloud AI**+ ou de cas d'application dans des secteurs spécifiques, HUAWEI CLOUD a démontré des capacités commerciales hautement matures et systématiques, ce qui impressionne vraiment l'industrie. ** Alors que tout le monde se dispute encore pour savoir qui est l'OpenAI chinois, HUAWEI CLOUD a ouvert une voie de développement assez mature pour les modèles à grande échelle.
Huawei utilise sa propre pratique pour prouver que les modèles à grande échelle sont importants, mais plus important encore, il s'agit d'utiliser des modèles à grande échelle pour résoudre les problèmes des industries et des produits, pour produire des produits et des services qui peuvent faire payer les entreprises et les utilisateurs , et de créer véritablement de la valeur pour des milliers d'industries.
01 Pangu Large Model 3.0 : architecture de découplage en couches
Le découplage est le mot clé du modèle Pangu 3.0 publié aujourd'hui. C'est également un appel commun des clients de l'industrie qui ont en fait invoqué de grands modèles au cours des derniers mois.
Un fournisseur SaaS de premier plan a déclaré lors de la sortie de sa propre application de mise à niveau de modèle à grande échelle : "Nous ne développons pas de modèles à grande échelle par nous-mêmes, mais dans différents scénarios commerciaux, quel modèle à grande échelle est bon pour quoi, nous prenons ce modèle." Afin de pouvoir basculer entre différents grands modèles, "notre propre architecture de produit doit être indépendante du grand modèle sous-jacent, ou faiblement couplée."
"La conception de découplage du grand modèle de Pangu est dans l'intérêt de l'industrie." Lors de la conférence des développeurs Huawei, Zhang Pingan, directeur exécutif de Huawei et PDG de Huawei Cloud, a donné l'itinéraire différencié du grand modèle de Pangu. Son cœur est de découpler les différentes couches et capacités du modèle Pangu, permettant aux utilisateurs de l'industrie de se développer en fonction de leurs propres besoins.
« 5 » représente les cinq grands modèles de base de la couche L0 : y compris les grands modèles de langage naturel, de vision, multimodaux, de prévision et de calcul scientifique, qui fournissent et répondent aux besoins de diverses compétences dans des scénarios industriels.
Pangu 3.0 fournit aux clients de grands modèles de base sérialisés avec 10 milliards de paramètres, 38 milliards de paramètres, 71 milliards de paramètres et 100 milliards de paramètres, correspondant aux besoins diversifiés des clients dans différents scénarios, différents retards et différentes vitesses de réponse. En même temps, il fournit un nouvel ensemble de fonctionnalités, y compris la réponse aux questions de connaissances, la génération de copie et la génération de code pour les grands modèles NLP, ainsi que la génération et la compréhension d'images pour les grands modèles multimodaux.Ces compétences peuvent être directement utilisées par les clients et les entreprises partenaires. Quelle que soit la taille du grand modèle, Pangu fournit un ensemble cohérent de fonctionnalités.
Le "N" dans la structure à trois niveaux "5+N+X" représente N grands modèles industriels au niveau L1. Il existe deux façons de fournir de grands modèles industriels : d'une part, HUAWEI CLOUD peut fournir de grands modèles industriels généraux formés à l'aide de données publiques de l'industrie, y compris les affaires gouvernementales, la finance, la fabrication, l'exploitation minière, la météo et d'autres grands modèles ; d'autre part, il peut être basé sur des clients de l'industrie Avec ses propres données, sur les couches L0 et L1 du grand modèle Pangea, il forme son propre grand modèle propriétaire pour les clients.
Zhang Pingan a déclaré : « Pangu est né pour servir l'industrie, et il fournit une variété de formes de déploiement, de développement et de raisonnement de modèles à grande échelle. Il peut générer son propre modèle industriel à grande échelle, tout comme le modèle à grande échelle de Pangu de Huawei. , et n'a besoin d'entrer que ses propres données privées. ." De plus, les données de formation sont également découplées du grand modèle.
Le X dans "5+N+X" signifie que la couche L2 fournit aux clients des modèles de scènes plus détaillés, se concentrant davantage sur les lignes directes des affaires gouvernementales, les assistants réseau, le dépistage de drogue, la détection de corps étrangers sur les tapis roulants et le typhon Paths Fournissez aux clients des services modèles « prêts à l'emploi » pour des applications sectorielles spécifiques ou des scénarios commerciaux spécifiques tels que les prévisions.
Grâce au grand modèle à trois couches de "** 5 + N + X", HUAWEI CLOUD a construit sa propre grande base de modèles.
Lors de la conférence mondiale sur l'intelligence artificielle d'hier, Hu Houkun, le président tournant de Huawei, a expliqué de manière éclatante : "Le niveau le plus élémentaire d'analyse comparative est le modèle général à grande échelle, que nous appelons le modèle de base à grande échelle. Notre image à ce niveau s'appelle la lecture des milliers de livres, ce qui est de bien faire. Une grande quantité de connaissances de base est apprise. Sur cette couche, des modèles industriels et des modèles de scène sont également créés, appelés parcourant des milliers de kilomètres. Il reste encore de nombreux défis à surmonter en lisant des milliers de livres. à parcourir des milliers de kilomètres. Le point clé est que Huawei travaille avec des partenaires de diverses industries pour faire correspondre et intégrer pleinement les connaissances de diverses industries avec de grands modèles.
** De plus, l'innovation du grand modèle n'est pas seulement l'innovation du modèle lui-même, mais dépend également de l'innovation de diverses technologies racines de l'IA. Lors de la réunion, Yao Jun, directeur du laboratoire de l'arche de Noé de Huawei, a présenté la base technique du modèle Pangu.
Huawei a construit une plate-forme cloud de puissance de calcul d'IA basée sur Kunpeng et Ascend à la couche inférieure, ainsi que l'architecture informatique hétérogène CANN, le cadre d'IA à scénario complet MindSpore et la ligne de production de développement d'IA ModelArts, etc., pour fournir des solutions distribuées pour le développement et l'exploitation de grands modèles.Capacités clés telles que l'accélération parallèle, l'optimisation de l'opérateur et de la compilation et l'optimisation de la communication au niveau du cluster. Sur la base de la technologie racine AI de Huawei, les performances de la formation de grands modèles peuvent être ajustées à 1,1 fois celles des GPU traditionnels du secteur.
Dans le même temps, 90 % des opérateurs de ces cadres peuvent être migrés en douceur vers la plate-forme Ascend via l'outil de migration de bout en bout de Huawei. Par exemple, Meitu a migré 70 modèles vers Ascend en seulement 30 jours. Dans le même temps, HUAWEI CLOUD et l'équipe Meitu ont optimisé conjointement plus de 30 opérateurs et accéléré le processus en parallèle. Par rapport à la solution d'origine, les performances de l'IA ont été amélioré de 30 %.
De plus, les pannes de GPU sont souvent rencontrées lors de la formation de grands modèles, et les développeurs doivent fréquemment redémarrer la formation, ce qui prend beaucoup de temps et coûte cher. Le service cloud Ascend AI peut fournir un service informatique AI plus stable.Le taux de stabilité à long terme de la formation de kilocalorie de 30 jours atteint 90% et le temps de récupération du point d'arrêt ne dépasse pas 10 minutes.
02 Autonomisez des milliers d'industries
Ren Zhengfei a précédemment déclaré: "La contribution directe des sociétés de plates-formes logicielles d'intelligence artificielle à la société humaine peut être inférieure à 2%, et 98% est la promotion de la société industrielle et de la société agricole. Mais la plate-forme d'application n'est pas notre option, nous serons la couche inférieure de la plate-forme de puissance AI Computing."
Laisser de grands modèles dans des milliers d'industries est devenu le centre du développement de grands modèles de Huawei. Lors de la réunion, HUAWEI CLOUD a présenté les cas d'application du grand modèle Pangu dans sept domaines, notamment les affaires gouvernementales, les chemins de fer, la météorologie et les finances.
Affaires du gouvernement
Selon Huawei Cloud, le cœur du grand modèle d'affaires gouvernementales de Pangu est la capacité cognitive. Laissez le système public urbain être vu et compris, et complétez la boucle fermée de la perception à la cognition et à l'élimination. Et selon différents scénarios, il offre différentes capacités telles que la réponse aux questions, la génération de copie, la perception vidéo et la compréhension multimodale.
chemin de fer
Les inspecteurs de train traditionnels doivent inspecter chaque jour des millions de photos de trains pour détecter s'il y a des défauts dans les wagons de marchandises circulant sur le réseau ferroviaire. Après l'introduction du grand modèle Pangu, il peut identifier avec précision 67 types de camions fonctionnant sur le réseau en direct et plus de 430 types de défauts, et le taux de dépistage des images non défectueuses atteint 95 %. En d'autres termes, les inspecteurs de train n'ont besoin de détecter que 1/20 des images de train dans le passé, ce qui équivaut à une augmentation de 20 fois de l'efficacité du travail.
mine de charbon
Dans le domaine des mines de charbon, le modèle à grande échelle de la mine de Pangu a été utilisé dans 8 mines à travers le pays. Un grand modèle peut couvrir plus de 1 000 scénarios subdivisés dans des processus commerciaux tels que l'exploitation minière, l'excavation, les machines, le transport, le transport, et le lavage des mines de charbon, permettant à plus de mineurs de charbon de travailler sur le terrain, ce qui non seulement rend l'environnement de travail des mineurs de charbon plus confortable, mais réduit également considérablement les accidents de sécurité.
météorologique
finance
Dans le domaine de la finance, Pangu Large Model a coopéré avec ICBC pour créer une série d'applications exploratoires.
L'un des scénarios typiques consiste à améliorer l'efficacité du travail des caissiers de banque. ICBC compte des dizaines de milliers de points de vente à travers le pays et 200 000 caissiers. Ils doivent basculer entre différents services, ce qui leur fera perdre beaucoup de temps.
Et ce n'est que l'application la plus basique.Huawei explore avec le secteur financier pour appliquer le grand modèle à des scénarios plus financiers tels que l'analyse de crédit à l'avenir.
fabrication
Huawei elle-même est également une entreprise de fabrication.Les produits matériels qu'elle fabrique comprennent des stations de base de communication, des téléphones portables, des automobiles, des puces et d'autres domaines. Sur la base de l'expérience accumulée dans le passé, Huawei a introduit le grand modèle Pangu dans le domaine de la production et de la fabrication.
Découverte de médicament
Dans le domaine de la recherche et du développement de médicaments, la recherche initiale et le développement d'un nouveau médicament prennent en moyenne 10 ans et coûtent 1 milliard de dollars américains. Le grand modèle moléculaire des médicaments Pangu a aidé l'équipe du professeur Liu Bing du premier hôpital affilié de l'Université Xi'an Jiaotong à découvrir la première nouvelle cible et la nouvelle classe d'antibiotiques au monde en 40 ans, et à raccourcir le cycle de développement du médicament principal à un mois et réduire le coût de développement de 70%.
03 Grand modèle intégré au système de produit Huawei Cloud
En plus de la pratique dans des milliers d'industries, le modèle HUAWEI CLOUD Pangu a également été profondément intégré dans les services produits de HUAWEI CLOUD pour restructurer l'innovation des produits.
Grand Modèle Pangu + Service Cloud Huawei
Avec la bénédiction du modèle Pangu, une série de produits et services B-end de Huawei Cloud ont été mis à niveau et reconstruits. Lors de la réunion, HUAWEI CLOUD a présenté les détails de quatre mises à niveau de service : service de données, service client cloud, BI et recherche cloud.
** Grand modèle Pangu + outil de code CodeArts **
L'outil a formé 76 milliards de lignes de codes sélectionnés et 13 millions de documents techniques. Il a trois fonctions principales de génération intelligente, de questions et réponses intelligentes et de collaboration intelligente. Il peut réaliser la génération de code en une phrase de dialogue, l'annotation automatique et la génération de cas de test en un clic Une commande peut être déployée intelligemment, de sorte que chaque développeur de logiciel dispose de son propre assistant de programmation.
Pangu Grand Modèle + Digital Man
Sur la base de ces deux services majeurs, les développeurs peuvent rapidement générer et piloter des modèles humains numériques, permettant l'éducation en ligne, la diffusion en direct de divertissement, les conférences d'entreprise et d'autres applications de l'industrie, afin que chaque employé de l'entreprise puisse réaliser la "liberté humaine numérique". Par exemple, les utilisateurs n'ont qu'à télécharger une vidéo personnelle de 20 secondes sur la page de service de HUAWEI CLOUD MetaStudio pour générer rapidement une vidéo d'explication humaine numérique personnalisée.Le travail effectué par trois membres du personnel de R&D en trois jours dans le passé peut désormais être terminé en seulement trois minutes.
Pangu Grand Modèle + Intelligence Incarnée
Lors de la réunion, Huawei Cloud a également mentionné l'application du modèle Pangu dans le domaine de la robotique et a présenté une vidéo.
Selon Huawei, la démonstration ci-dessus n'est pas une vidéo conceptuelle, mais un produit réel, qui a été exposé sur place lors de la conférence HDC.
**04 Synthèse et réflexion : Huawei peut-il devenir l'autre pôle de l'IA ? **
Zhang Pingan a déclaré : "Afin d'aider les clients, partenaires et développeurs mondiaux à former et à utiliser de grands modèles, nous nous engageons à créer un monde pour les clients mondiaux IA **Un autre pôle, fournissant de nouveaux développeurs d'IA s Choix". **
Même plus tôt, dès mars de cette année, Ren Zhengfei avait exprimé une signification similaire au sein de l'entreprise. Il a déclaré qu'il y aurait une augmentation des modèles d'IA, pas seulement de Microsoft. La raison de Ren Zhengfei est en fait la direction des efforts de Huawei Cloud aujourd'hui, c'est-à-dire que la contribution directe des sociétés de plateformes logicielles d'intelligence artificielle à la société humaine peut être inférieure à 2 %, et 98 % est la promotion de la société industrielle et de la société agricole.
Par exemple, des usines en Chine et en Allemagne encouragent la promotion de l'intelligence artificielle dans l'industrie, afin de réaliser une production sans personnel ; par exemple, le quai du port de Tianjin a également essayé le chargement et le déchargement de marchandises sans personnel. Une fois le code saisi, le le conteneur sera automatiquement retiré du navire. Transportez-le puis transportez-le en voiture ; par exemple, dans la mine de charbon du Shanxi, après l'adoption de l'intelligence artificielle 5G+ sous terre, le nombre de personnel a été réduit de 60 à 70 %, et la plupart des gens travaillent en costume dans la salle de contrôle au sol.
Ce sont des exemples où l'IA a été appliquée à grande échelle au côté industriel au cours des dernières années.Ce que ces industries ont en commun, c'est qu'elles ont une échelle et une valeur de production énormes, et une petite amélioration de l'efficacité peut apporter d'énormes avantages.
** L'émergence de grands modèles fournit essentiellement des outils de productivité plus efficaces. ** D'une part, pour ces industries qui adoptent déjà l'IA, cela signifie une plus grande efficacité et un processus de transformation plus rapide ; et une plus grande efficacité signifie également qu'il est plus facile pour un plus grand nombre d'industries de calculer le "compte économique" ", l'IA a le potentiel passer de quelques soi-disant grandes industries à la transformation de milliers d'industries.
C'est la raison pour laquelle Huawei entre résolument dans l'industrie.En fait, les principales sociétés nationales de services cloud telles que Alibaba Cloud, Tencent Cloud, Volcano Cloud et Baidu Cloud ont des idées similaires. Dans le cas d'une même direction et d'un point de départ proche, qui peut courir le plus rapidement dans cette compétition, c'est toute la capacité de la chaîne, de la puissance de calcul, de la grande base de modèles, de la plate-forme, des produits aux solutions spécifiques.
Pour des raisons bien connues, Huawei ne peut pas obtenir la puce informatique la plus avancée au monde, qui est actuellement reconnue, et il semble qu'elle soit intrinsèquement insuffisante dans cette compétition. Mais à en juger par la conférence de presse d'aujourd'hui, Huawei ne voit pas qu'il est à la traîne en raison des contraintes du haut de gamme.Dans le porte-clés du grand modèle, il a proposé des produits et des étuis matures, et le grand Pangu découplé l'architecture du modèle est encore plus C'est accrocheur. ** En fait, compte tenu des besoins de localisation aujourd'hui, Huawei, qui n'est pas en reste en termes de puissance de calcul, est susceptible de devenir un avantage indépendant et contrôlable. **
Les grands modèles sont devenus une nouvelle opportunité pour Huawei, et il semble que cela devienne une réalité.