Source : Limite de la ville
L'originalité rend les affaires plus précieuses
La concurrence pour les grands modèles a finalement atteint le stade de la guerre des prix, perturbée par le retard de Byte. D'une part, cela pourrait accélérer le développement d'industries océaniques bleues axées sur les applications et l'écologie, et donner naissance à des applications populaires dès que possible. D'un autre côté, la réponse des entrepreneurs a été relativement modérée. Ils espèrent que les grands fabricants pourront offrir aux développeurs une valeur plus professionnelle et plus claire en plus d'appels API à bas prix relativement « insipides ».
Les guerres des prix en Chine ont toujours été le scénario le plus familier, le plus douloureux et finalement inévitable. En seulement 10 jours, Byte, qui avait autrefois choisi « d'attendre et de voir », a été pris au dépourvu et a lancé une bombe royale « à bas prix », amenant la guerre des grands modèles dans la séquence suivante.
Le 15 mai, lors de la « FORCE Motive Power Conference » de ByteDance, en sautant l'introduction et la transition, le président de Volcano Engine, Tan Dai, a révélé le dernier prix des « poufs » en une seule étape : 0,0008 yuans/mille jetons, annonçant qu'il était inférieur au prix des « poufs ». "prix plancher" de 99,3% de l'industrie.
Il a également fait une annonce très médiatisée à Alibaba et Baidu : il s'agit d'une réduction de prix pour les principaux modèles, pas d'une réduction de prix pour les petits modèles pour semer la confusion dans l'esprit du public. "C'est dommage qu'Alibaba et Baidu ne disposent pas encore de 128 000 modèles personnalisables, mais j'attends avec impatience leurs mises à jour."
▲(Tan Dai à la « Conférence FOECE » 2024. Source/Volcano Engine)
Les « cercles urbains » ont appris de nombreuses sources que des acteurs de premier plan tels qu’Alibaba, Baidu et Tencent ne sont pas préparés à l’attaque de Byte ; même si toutes les parties se sentent impuissantes, elles ne peuvent que suivre passivement.
Le 21 mai, Alibaba Cloud a annoncé que le prix des jetons d'entrée d'inférence pour bon nombre de ses grands modèles serait réduit de 67 à 97 %. Le même jour, les deux modèles de Baidu Wenxin Model, ENIRE Speed et ENIRE Lite, ont été annoncés comme étant gratuits. Le 22 mai, Tencent Cloud a annoncé que le prix de bon nombre de ses jetons d'entrée d'inférence de grands modèles serait réduit de 50 à 87,5 %.
Du point de vue de l’industrie, les guerres de prix pour les grands modèles sont, dans une certaine mesure, inévitables. D'une part, la baisse continue du prix de la puissance de calcul d'inférence constitue la base des guerres des prix ; alors que le développement de grands modèles génératifs n'en est qu'à ses débuts et que l'écart entre chaque entreprise n'est pas encore évident. Dans le même temps, l'océan bleu des applications de volume et de l'écologie du volume se dévoile, et les réductions de prix des fabricants de cloud attireront davantage de développeurs et de commerçants pour agrandir conjointement le gâteau.
Cependant, comparé aux opérations de haut niveau des grands fabricants, la plupart des développeurs de modèles à grande échelle et des entrepreneurs contactés par le « secteur urbain » ont obtenu des résultats médiocres. Bien qu'ils pensent que la guerre des prix dissipera certaines des préoccupations liées aux coûts de l'IA, de plus en plus de gens pensent que la plupart des modèles open source dont les grands fabricants ont réduit les prix sont de petits modèles et qu'il existe de nombreuses restrictions sur leur utilisation. loin d'être authentique.
Octet "Poisson-chat"
Beaucoup de gens ne soupçonnaient pas que l'initiateur de la guerre des prix...
[Courte citation de 8% de l'article original]