「ビッグモデル+スモールモデル」の新時代が幕を開ける、AI基本ソフトがAIの未来を決める
説明: AI 新時代への AI 企業の対応
5月30日、中国情報通信技術院、浙江省経済情報技術局、杭州市人民政府、中国人工知能産業発展同盟が主催する「杭州総合人工知能フォーラム」が盛大に開催された。杭州市人民政府党指導グループのメンバーで副市長の孫旭東氏、浙江省経済情報技術局の技術主任李永偉氏、中国信息アカデミー党委員会副書記の王暁利氏、通信技術、中国工程院学会員で中国人工知能産業発展同盟会長の潘雲和氏、その他何百人もの政府幹部、指導者、優れたAI企業の代表者、一流大学の専門家や学者、主流メディアが集まりました。大規模モデル適用の機会と課題について議論する会議。 Jiuzhang Yunji DataCanvas Company の会長である Fang Lei 氏がカンファレンスに招待され、「AI 基本ソフトウェアが大規模モデル アプリケーションの急速な開発を促進する」について基調講演を行いました。
Jiuzhang Yunji DataCanvas Company 会長 Fang Lei 氏
AI基本ソフトが鍵、「大小」の新時代が始まる
最近リリースされた大規模モデルの応用例が次々と登場し、業界の変化について新たな考え方を引き起こし、人工知能の分野にも変革をもたらす可能性があります。方磊氏は、中国の特色あるAI産業の発展過程において、中央エンタープライズクラウド、コンピューティングパワー構築、大型モデルが産業発展の「トロイカ」を構成し、三者相互の因果関係、相互促進の影響下にあると提案した。と相互に重ね合わせて、我が国のAI産業は驚異的な発展を遂げるでしょう。
Fang Lei 氏は、新しいインフラが絶好のチャンスをもたらすと指摘しました。中央エンタープライズクラウド、特にオペレータークラウドの構築は急速に成長しており、その規模はすでに大手クラウドベンダーに匹敵する規模となっており、同時に新興の中央エンタープライズクラウドもコンピューティングパワーの新たなインフラ構築の一部を担うことになる。 。この成長率の影響により、エコシステム内のソフトウェアメーカーとハードウェアメーカーの協力モデルが変化し、クラウドコンピューティングの状況も変化するでしょう。
コンピューティング能力の点では、コンピューティング能力自体への巨額のハードウェア投資が豊富なコンピューティング能力をもたらすだけでなく、エンドツーエンドのコンピューティング能力最適化の余地も大きく、コンピューティング能力の価格はもはや上昇しません。ギャップになる。テクノロジーが特異点を超えると、AI 基本ソフトウェアの重要性がさらに高まります。大規模モデルアプリケーションの費用対効果は、モデルエコシステムの中核となるAIインフラソフトウェアの性能によって決まります。
現在、大規模モデルは良好なパフォーマンスを示していますが、実際にさまざまな業界のビジネス シナリオに適用するには、技術的およびコストのしきい値が依然として高いです。 Fang Lei氏は、現在の「サイズ」の時代が到来しており、大型モデルと小型モデルの統合と使用だけでなく、大型モデルの小型化、または大型モデルに基づく小型化と微調整も行われていると指摘しました。このような手法により、低コストで多くの問題を解決できます。
「大小は相対的な変化です。」 現在、大規模モデルのパラメータ基準は統一されていません。パラメータ レベルと比較して、モデルの効果と、モデルが迅速な反復をサポートできるかどうかが、ユーザーの実用上より重要です。アプリケーション。ユーザーは、大規模なホワイトボックス モデルに基づいて、カスタマイズされた小規模モデルを迅速かつコスト効率よく微調整して反復できるため、豊富なシナリオで大規模なモデル アプリケーションを効率的に実装できます。これは、基本的な AI ソフトウェア ツール チェーンの重要性を改めて浮き彫りにします。
マルチモダリティは、「ソフトウェア」から「思考ウェア」まで、新しい AI の未来を定義します
マルチモーダル大型モデル技術の人気は、業界の再編を促進しているだけではありません。Fang Lei 氏は、「マルチモーダル」が AI の新しい未来を切り開くと信じています。それ以来、モデルとデータの関係はセックスやソフトウェアが再定義される可能性があります。
マルチモダリティには、画像やテキストだけでなく、センサー データと構造化データの融合も含まれます。マルチモダリティにより、AI ソフトウェアとセンサーおよび物理世界をリンクすることで、世界を操作できるようになります。これは、AI によって人間の脳のプロトタイプを見ることができた初めてのことです。これは、大型モデルと同じくらい歴史的に重要です。
第二に、マルチモダリティによりデータの統合が実現され、これはベクトル化時代の到来の兆しです。これまでナレッジ ベースとデータ ウェアハウスを連携させた企業が存在しなかったように、当然不可能な状況と考えられますが、現在のドキュメントのベクトル化は大規模なモデルによって実現されています。すべてのデータはベクトル データの形式でマルチモーダル ベースで統合できます。これは、データが初めて真に「統合」されることを意味します。大規模な逆モデリングによってもたらされるこの革命は、データを活用する能力を飛躍的に向上させるでしょう。
Fang Lei は、将来のテクノロジーが変化をもたらし、ソフトウェア業界を再定義すると予測しています。従来のソフトウェアはプロセスの自動化や業務の前進のためのツールでしたが、マルチモーダルな大型モデルの影響を受けて、将来のソフトウェアは逆に柔軟にさまざまな形に組み立てられ、人々のアイデアに応じてユーザーにサービスを提供するようになるのと全く同じです。 Jiuzhang Yunji DataCanvas が提案する AI ソフトウェアの変革の方向性は、「ソフトウェア」からあらゆる階層を支援する「思考ウェア」へ。
Jiuzhang Yunji DataCanvas Company は、AI 基本ソフトウェアのサプライヤーとして、常に「顧客が独立した AI 機能を持てるようにする」というポジショニングを堅持してきましたが、マルチモーダルな大規模モデルの影響を受ける AI 時代においても、このポジショニングは堅固です。将来的には、AI 業界の発展は、百花が咲く多様な道に向かって加速するでしょう。Jiuzhang Yunji DataCanvas は、一連の独立した革新的なオープン、自動、クラウドネイティブの A ベースのソフトウェア ツールに依存して、業界全体とともにベクトル世界の未来を目指します。
以上が「ビッグモデル+スモールモデル」の新時代が幕を開ける、AI基本ソフトがAIの未来を決めるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











5月30日、TencentはHunyuanモデルの包括的なアップグレードを発表し、Hunyuanモデルに基づくアプリ「Tencent Yuanbao」が正式にリリースされ、AppleおよびAndroidアプリストアからダウンロードできるようになりました。前のテスト段階のフンユアン アプレット バージョンと比較して、Tencent Yuanbao は、日常生活シナリオ向けの AI 検索、AI サマリー、AI ライティングなどのコア機能を提供し、Yuanbao のゲームプレイもより豊富で、複数の機能を提供します。 、パーソナルエージェントの作成などの新しいゲームプレイ方法が追加されます。 Tencent Cloud 副社長で Tencent Hunyuan 大型モデルの責任者である Liu Yuhong 氏は、「テンセントは、最初に大型モデルを開発しようとはしません。」と述べました。 Tencent Hunyuan の大型モデルは、ビジネス シナリオにおける豊富で大規模なポーランド テクノロジーを活用しながら、ユーザーの真のニーズを洞察します。

Volcano Engine の社長である Tan Dai 氏は、大規模モデルを実装したい企業は、モデルの有効性、推論コスト、実装の難易度という 3 つの重要な課題に直面していると述べました。複雑な問題を解決するためのサポートとして、適切な基本的な大規模モデルが必要です。また、サービスは低コストの推論を備えているため、大規模なモデルを広く使用できるようになり、企業がシナリオを実装できるようにするためには、より多くのツール、プラットフォーム、アプリケーションが必要になります。 ——Huoshan Engine 01 社長、Tan Dai 氏。大きなビーンバッグ モデルがデビューし、頻繁に使用されています。モデル効果を磨き上げることは、AI の実装における最も重要な課題です。 Tan Dai 氏は、良いモデルは大量に使用することでのみ磨かれると指摘しました。現在、Doubao モデルは毎日 1,200 億トークンのテキストを処理し、3,000 万枚の画像を生成しています。企業による大規模モデルシナリオの実装を支援するために、バイトダンスが独自に開発した豆包大規模モデルが火山を通じて打ち上げられます。

1. TensorRT-LLM の製品位置付け TensorRT-LLM は、NVIDIA が開発した大規模言語モデル (LLM) 向けのスケーラブルな推論ソリューションです。 TensorRT 深層学習コンパイル フレームワークに基づいて計算グラフを構築、コンパイル、実行し、FastTransformer の効率的なカーネル実装を利用します。さらに、デバイス間の通信には NCCL を利用します。開発者は、カットラスに基づいてカスタマイズされた GEMM を開発するなど、技術開発や需要の違いに基づいて特定のニーズを満たすためにオペレーターをカスタマイズできます。 TensorRT-LLM は、NVIDIA の公式推論ソリューションであり、高いパフォーマンスを提供し、実用性を継続的に向上させることに尽力しています。 TensorRT-LL

1. 背景の紹介 まず、Yunwen Technology の開発の歴史を紹介します。 Yunwen Technology Company ...2023 年は大規模モデルが普及する時期であり、多くの企業は大規模モデルの後、グラフの重要性が大幅に低下し、以前に検討されたプリセット情報システムはもはや重要ではないと考えています。しかし、RAG の推進とデータ ガバナンスの普及により、より効率的なデータ ガバナンスと高品質のデータが民営化された大規模モデルの有効性を向上させるための重要な前提条件であることがわかり、ますます多くの企業が注目し始めています。知識構築関連コンテンツへ。これにより、知識の構築と処理がより高いレベルに促進され、探索できる技術や方法が数多く存在します。新しいテクノロジーの出現によってすべての古いテクノロジーが打ち破られるわけではなく、新旧のテクノロジーが統合される可能性があることがわかります。

4月4日のニュースによると、中国サイバースペース局は最近、登録された大型モデルのリストを発表し、その中にチャイナモバイルの「九天自然言語インタラクション大型モデル」が含まれており、チャイナモバイルの九天AI大型モデルが生成人工言語を正式に提供できることを示した。外部世界への諜報機関。チャイナモバイルは、これは中央企業が開発した初めての大規模モデルであり、国家の「生成人工知能サービス登録」と「国内深層合成サービスアルゴリズム登録」の二重登録を通過したと述べた。報告によると、Juiutian の自然言語インタラクション大規模モデルは、強化された業界能力、セキュリティ、信頼性の特徴を持ち、フルスタック ローカリゼーションをサポートしており、90 億、139 億、570 億、1000 億などのさまざまなパラメータ バージョンを形成しており、クラウド、エッジ、エンドでは状況が異なりますが、柔軟に導入できます。

この男性は 1,000 を超える大型モデルを接続し、シームレスに接続して切り替えることができることに注目してください。最近、ビジュアル AI ワークフローが開始されました。直感的なドラッグ アンド ドロップ インターフェイスを提供し、ドラッグ、プル、ドラッグして、無限のキャンバス上に独自のワークフローを配置できます。ことわざにあるように、戦争にはスピードがかかります。Qubit は、この AIWorkflow がオンラインになってから 48 時間以内に、ユーザーがすでに 100 ノードを超える個人ワークフローを構成したと聞きました。早速ですが、今日私が話したいのは、LLMOps 企業である Dify とその CEO の Zhang Luyu についてです。 Zhang Luyu は Dify の創設者でもあります。ビジネスに入社する前は、インターネット業界で 11 年の経験がありました。私は製品設計に携わっており、プロジェクト管理を理解しており、SaaS について独自の洞察を持っています。その後彼は

テストの問題が簡単すぎると、上位の生徒も下位の生徒も 90 点を獲得でき、その差は広がりません。Claude3、Llama3、さらには GPT-5 などのより強力なモデルが後にリリースされるため、業界はより困難で差別化されたモデルのベンチマークが緊急に必要です。大型モデルアリーナの背後にある組織 LMSYS は、次世代ベンチマーク Arena-Hard を発表し、広く注目を集めました。 Llama3 命令の 2 つの微調整されたバージョンの強度に関する最新のリファレンスもあります。全員が同様のスコアを持っていた以前の MTBench と比較すると、アリーナとハードの識別は 22.6% から 87.4% に増加し、一目で強くも弱くもなりました。 Arena-Hard は、アリーナからのリアルタイムの人間データを使用して構築されており、人間の好みとの一致率は 89.1% です。

「高度な複雑性、高度な断片化、およびクロスドメイン」は、輸送業界のデジタル化およびインテリジェントなアップグレードに向かう上で常に主要な問題点でした。最近、チャイナビジョン、西安雁塔区政府、西安未来人工知能コンピューティングセンターが共同で構築したパラメータースケール1000億の「秦嶺・秦川交通モデル」は、スマート交通・交通分野を指向している。西安とその周辺地域にサービスを提供しており、この地域はスマート交通イノベーションの拠点となるでしょう。 「秦嶺・秦川交通モデル」は、オープンシナリオにおける西安の膨大な地元交通生態データ、中国科学ビジョンが自社開発したオリジナルの高度なアルゴリズム、そして西安未来人工知能コンピューティングセンターのShengteng AIの強力なコンピューティング能力を組み合わせたものです。道路網の監視を提供するため、緊急指令、メンテナンス管理、公共交通機関などのスマートな交通シナリオは、デジタルでインテリジェントな変化をもたらします。交通管理には都市ごとに異なる特徴があり、道路の交通状況も異なります。
