'대형+소형' 시대 개막, AI 베이직 소프트웨어가 AI의 미래를 정의하다
설명: 새로운 AI 시대를 맞이한 AI 기업의 대응
5월 30일, 중국정보통신기술원, 저장성 경제정보기술부, 항저우시 인민정부, 중국 인공지능 산업 발전 연합이 주최한 '항저우 종합 인공지능 포럼'이 성대하게 열렸습니다. 항저우시 인민정부 당영도그룹 위원이자 부시장인 Sun Xudong, 저장성 경제정보기술부 수석 엔지니어인 Li Yongwei, 중국정보학원 당위원회 부서기 Wang Xiaoli Communications Technology, 중국 공학원 원사이자 중국 인공 지능 산업 발전 연합 회장인 Pan Yunhe를 비롯한 수백 명의 정부 임원 지도자, 뛰어난 AI 기업 대표, 일류 대학의 전문가 및 학자, 주류 언론이 모였습니다. 대형 모델 적용의 기회와 과제를 논의하는 컨퍼런스입니다. Jiuzhang Yunji DataCanvas Company의 Fang Lei 회장은 컨퍼런스에 초대되어 "AI 기본 소프트웨어가 대형 모델 애플리케이션의 신속한 개발을 촉진합니다"라는 주제로 기조 연설을 했습니다.
Fang Lei, Jiuzhang Yunji DataCanvas Company 회장
AI 기본 소프트웨어가 핵심, '빅+스몰'의 새로운 시대가 시작됐다
최근 출시된 대규모 모델 애플리케이션이 속속 등장하며 업계 변화에 대한 새로운 생각을 촉발하고, 심지어 인공지능 분야를 재편할 수도 있다. Fang Lei는 중국 특성을 지닌 AI 산업의 발전 과정에서 중앙 기업 클라우드, 컴퓨팅 성능 구축 및 대형 모델이 3자 상호 인과, 상호 촉진의 영향을 받아 산업 발전의 '트로이카'를 구성한다고 제안했습니다. 그리고 상호 중첩, 우리나라의 AI 산업은 엄청난 발전을 가져올 것입니다.
Fang Lei는 새로운 인프라가 절호의 기회를 가져올 것이라고 지적했습니다. 중앙 기업 클라우드, 특히 운영자 클라우드의 구축은 빠르게 성장하고 있으며 그 규모는 이미 주요 클라우드 공급업체의 규모와 비슷합니다. 동시에 신흥 중앙 기업 클라우드도 컴퓨팅 성능의 새로운 인프라 구축의 일부를 맡게 될 것입니다. . 이러한 성장률의 영향으로 생태계 내 소프트웨어 및 하드웨어 제조업체의 협력 모델이 변화하고 클라우드 컴퓨팅 환경도 변화할 것입니다.
컴퓨팅 파워 측면에서 컴퓨팅 파워 자체에 대한 막대한 하드웨어 투자는 풍부한 컴퓨팅 파워를 가져올 뿐만 아니라 엔드투엔드 컴퓨팅 파워 최적화를 위한 거대한 여지도 있으며 컴퓨팅 파워의 가격은 더 이상 갭. 기술이 특이점을 넘을 때 AI 기본 소프트웨어의 중요성은 더욱 부각된다. 대규모 모델 적용의 비용 효율성은 모델 생태계의 핵심인 AI 인프라 소프트웨어의 성능에 따라 결정될 것이다.
현재 대규모 모델의 성능이 우수하지만 다양한 산업 분야의 비즈니스 시나리오에 실제로 적용하기에는 여전히 기술적, 비용적 한계가 높습니다. Fang Lei는 현재 '큰 + 작은' 시대가 대형 모델과 소형 모델의 통합 및 사용뿐만 아니라 대형 모델의 소형화 또는 대형 모델을 기반으로 한 소형화 및 미세 조정을 불러오고 있다고 지적했습니다. 이 접근 방식은 저렴한 비용으로 많은 문제를 해결할 수 있는 추세이기도 합니다.
"크고 작은 것은 상대적인 변화입니다." 현재 대형 모델의 매개변수 표준은 균일하지 않습니다. 매개변수 수준에 비해 모델의 효과와 빠른 반복을 지원할 수 있는지 여부는 사용자의 실제 적용에 더 중요합니다. 사용자는 대규모 화이트박스 모델을 기반으로 맞춤형 소형 모델을 빠르고 비용 효율적으로 미세 조정하고 반복할 수 있으므로 다양한 시나리오에서 대규모 모델 애플리케이션을 효율적으로 구현할 수 있습니다. 이는 기본 AI 소프트웨어 도구 체인의 중요성을 다시 한 번 강조합니다.
다중양식은 “소프트웨어”에서 “사고-웨어”까지 새로운 AI 미래를 정의합니다
멀티모달 대형 모델 기술의 인기는 업계의 구조 조정을 촉발할 뿐만 아니라 "멀티모달리티"가 AI의 새로운 미래를 열어줄 것이라고 믿습니다. 소프트웨어는 더욱 미묘하고 혁신적으로 재정의될 수 있습니다.
멀티모달리티에는 사진과 텍스트뿐만 아니라 센서 데이터와 구조화된 데이터의 융합도 포함됩니다. 다중 양식을 통해 AI 소프트웨어를 센서와 물리적 세계에 연결하여 세상을 운영할 수 있습니다. 이는 AI를 통해 인간 두뇌의 프로토타입을 볼 수 있게 된 최초의 사례입니다. 이는 대형 모델만큼 역사적으로 중요한 의미를 갖습니다.
둘째, 다중 양식은 벡터화 시대의 도래를 알리는 데이터의 통일성을 달성할 것입니다. 과거 어떤 기업도 지식베이스와 데이터웨어 하우스를 연결하지 않은 것처럼 당연히 불가능한 상황으로 간주됩니다. 그러나 현재 문서의 벡터화는 대규모 모델을 통해 구현되었습니다. 모든 데이터는 벡터 데이터 형태로 다중 모드 기반으로 통합될 수 있으며, 이는 데이터가 처음으로 진정으로 "통합"되었음을 의미합니다. 대규모 역모델링이 가져온 이러한 혁명은 데이터 활용 능력을 기하급수적으로 향상시킬 것입니다.
Fang Lei는 미래 기술이 변화를 가져오고 소프트웨어 산업을 재정의할 것이라고 예측합니다. 전통적인 소프트웨어는 프로세스 자동화 및 전방 작업을 위한 도구이지만, 다중 모드 대형 모델의 영향으로 미래의 소프트웨어는 사람들의 아이디어에 따라 사용자에게 서비스를 제공하기 위해 역으로 유연하게 조립될 것입니다. Jiuzhang Yunji DataCanvas가 제안하는 AI 소프트웨어의 전환 방향은 '소프트웨어'에서 각계에 도움이 되는 '생각-웨어'로입니다.
AI 기본 소프트웨어 공급업체인 Jiuzhang Yunji DataCanvas Company는 다중 모드 대형 모델의 영향을 받는 AI 시대에도 항상 "고객이 독립적인 AI 기능을 가질 수 있도록 허용"한다는 입장을 고수해 왔습니다. 앞으로 AI 산업의 발전은 백 송이의 꽃이 피는 다양한 경로를 향해 가속화될 것입니다. Jiuzhang Yunji DataCanvas는 일련의 독립적인 혁신적인 개방형, 자동, 클라우드 기반 A 기반 소프트웨어 도구를 사용하여 AI 산업을 탐구할 것입니다. 전체 산업과 함께 벡터 세계의 미래를 함께 만들어가겠습니다.
위 내용은 '대형+소형' 시대 개막, AI 베이직 소프트웨어가 AI의 미래를 정의하다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

5월 30일, Tencent는 Hunyuan 모델의 포괄적인 업그레이드를 발표했습니다. Hunyuan 모델을 기반으로 하는 앱 "Tencent Yuanbao"가 공식 출시되었으며 Apple 및 Android 앱 스토어에서 다운로드할 수 있습니다. 이전 테스트 단계의 Hunyuan 애플릿 버전과 비교하여 Tencent Yuanbao는 일상 생활 시나리오를 위한 작업 효율성 시나리오를 위한 AI 검색, AI 요약 및 AI 작성과 같은 핵심 기능을 제공하며 Yuanbao의 게임 플레이도 더욱 풍부해지고 다양한 기능을 제공합니다. , 개인 에이전트 생성과 같은 새로운 게임 플레이 방법이 추가됩니다. Tencent Cloud 부사장이자 Tencent Hunyuan 대형 모델 책임자인 Liu Yuhong은 "Tencent는 먼저 대형 모델을 만들기 위해 노력하지 않을 것입니다."라고 말했습니다. Tencent Hunyuan 대형 모델 비즈니스 시나리오에서 풍부하고 방대한 폴란드 기술을 활용하면서 사용자의 실제 요구 사항에 대한 통찰력을 얻습니다.

Volcano Engine의 Tan Dai 사장은 대형 모델을 구현하려는 기업은 모델 효율성, 추론 비용, 구현 어려움이라는 세 가지 주요 과제에 직면하게 된다고 말했습니다. 복잡한 문제를 해결하기 위한 지원으로 좋은 기본 대형 모델이 있어야 하며, 서비스를 통해 대규모 모델을 널리 사용할 수 있으며 기업이 시나리오를 구현하는 데 더 많은 도구, 플랫폼 및 애플리케이션이 필요합니다. ——Tan Dai, Huoshan Engine 01 사장. 대형 빈백 모델이 출시되어 많이 사용되고 있습니다. 모델 효과를 연마하는 것은 AI 구현에 있어 가장 중요한 과제입니다. Tan Dai는 좋은 모델은 많은 양의 사용을 통해서만 연마될 수 있다고 지적했습니다. 현재 Doubao 모델은 매일 1,200억 개의 텍스트 토큰을 처리하고 3,000만 개의 이미지를 생성합니다. 기업이 대규모 모델 시나리오를 구현하는 데 도움을 주기 위해 ByteDance가 독자적으로 개발한 beanbao 대규모 모델이 화산을 통해 출시됩니다.

1. TensorRT-LLM의 제품 포지셔닝 TensorRT-LLM은 NVIDIA에서 LLM(대형 언어 모델)을 위해 개발한 확장 가능한 추론 솔루션입니다. TensorRT 딥 러닝 컴파일 프레임워크를 기반으로 계산 그래프를 구축, 컴파일 및 실행하고 FastTransformer의 효율적인 커널 구현을 활용합니다. 또한 장치 간 통신에는 NCCL을 활용합니다. 개발자는 커틀라스를 기반으로 한 맞춤형 GEMM을 개발하는 등 기술 개발 및 수요 차이를 기반으로 특정 요구 사항을 충족하도록 운영자를 맞춤화할 수 있습니다. TensorRT-LLM은 고성능을 제공하고 실용성을 지속적으로 개선하기 위해 노력하는 NVIDIA의 공식 추론 솔루션입니다. 텐서RT-LL

1. 배경 소개 먼저 Yunwen Technology의 발전 역사를 소개하겠습니다. Yunwen Technology Company...2023년은 대형 모델이 유행하는 시기입니다. 많은 기업에서는 대형 모델 이후 그래프의 중요성이 크게 감소했으며 이전에 연구된 사전 설정 정보 시스템이 더 이상 중요하지 않다고 생각합니다. 그러나 RAG의 홍보와 데이터 거버넌스의 확산으로 우리는 보다 효율적인 데이터 거버넌스와 고품질 데이터가 민영화된 대형 모델의 효율성을 향상시키는 중요한 전제 조건이라는 것을 알게 되었습니다. 따라서 점점 더 많은 기업이 주목하기 시작했습니다. 지식 구축 관련 콘텐츠에 이는 또한 탐구할 수 있는 많은 기술과 방법이 있는 더 높은 수준으로 지식의 구성 및 처리를 촉진합니다. 신기술의 출현이 기존 기술을 모두 패배시키는 것이 아니라, 신기술과 기존 기술을 통합할 수도 있음을 알 수 있습니다.

4월 4일 뉴스에 따르면 중국 사이버공간국은 최근 등록된 대형 모델 목록을 공개했는데, 여기에 차이나 모바일의 'Jiutian Natural Language Interaction Large Model'이 포함돼 있어 차이나 모바일의 Jiutian AI 대형 모델이 공식적으로 생성 인공 지능을 제공할 수 있음을 알렸다. 외부 세계에 대한 정보 서비스. 차이나 모바일은 이 모델이 중앙 기업이 개발한 최초의 대규모 모델로 국가 '생성 인공 지능 서비스 등록'과 '국내 심층 합성 서비스 알고리즘 등록' 이중 등록을 모두 통과했다고 밝혔습니다. 보고서에 따르면 Jiutian의 자연어 상호 작용 대형 모델은 향상된 산업 역량, 보안 및 신뢰성을 갖추고 있으며 풀 스택 현지화를 지원하며 90억, 139억, 570억, 1000억 등 다양한 매개변수 버전을 형성했습니다. 클라우드에 유연하게 배포할 수 있으며 엣지와 엔드는 상황이 다릅니다.

주의하세요. 이 사람은 1,000개 이상의 대형 모델을 연결하여 원활하게 연결하고 전환할 수 있습니다. 최근에는 시각적인 AI 워크플로우가 출시되었습니다. 직관적인 드래그 앤 드롭 인터페이스를 제공하여 무한한 캔버스에 드래그하고 당기고 드래그하여 자신만의 워크플로우를 배열할 수 있습니다. 속담처럼 전쟁에는 속도가 필요하며 Qubit은 이 AIWorkflow가 온라인에 접속한 후 48시간 이내에 사용자가 이미 100개 이상의 노드로 개인 워크플로를 구성했다는 소식을 들었습니다. 더 이상 고민하지 않고 오늘 제가 이야기하고 싶은 것은 LLMOps 회사인 Dify와 그 CEO인 Zhang Luyu입니다. Zhang Luyu는 Dify의 창립자이기도 합니다. 사업에 합류하기 전에 그는 인터넷 업계에서 11년의 경력을 쌓았습니다. 저는 제품 디자인에 참여하고 있으며 프로젝트 관리를 이해하고 있으며 SaaS에 대한 독특한 통찰력을 가지고 있습니다. 나중에 그는

시험 문제가 너무 단순하면 상위권 학생과 하위 학생 모두 90점을 받을 수 있어 격차가 더 벌어질 수 없다… 클로드3, 라마3, 심지어 GPT-5 등 더욱 강력한 모델이 출시되면서 업계는 보다 어렵고 차별화된 모델 벤치마크가 시급히 필요합니다. 대형 모델 아레나를 운영하는 조직인 LMSYS가 차세대 벤치마크인 Arena-Hard를 출시해 큰 관심을 끌었습니다. Llama3 명령의 두 가지 미세 조정 버전의 강점에 대한 최신 참조도 있습니다. 이전에 비슷한 점수를 받았던 MTBench와 비교하면 Arena-Hard 판별력이 22.6%에서 87.4%로 증가해 한눈에 봐도 강하고 약해졌습니다. Arena-Hard는 경기장의 실시간 인간 데이터를 사용하여 구축되었으며 인간 선호도와 89.1%의 일치율을 가지고 있습니다.

"높은 복잡성, 높은 단편화 및 교차 도메인"은 항상 운송 산업의 디지털 및 지능적 업그레이드로 가는 길의 주요 문제점이었습니다. 최근에는 China Vision, Xi'an Yanta District Government, Xi'an Future Artificial Intelligence Computing Center가 공동으로 구축한 매개변수 규모 1,000억 규모의 '친링·친추안 교통 모델'이 스마트 교통 및 스마트 교통 분야를 지향하고 있습니다. 시안과 그 주변 지역에 서비스를 제공하여 스마트 교통 혁신의 거점을 만들 것입니다. '친링·친추안 교통 모델'은 개방형 시나리오의 시안의 대규모 지역 교통 생태 데이터, China Vision이 독자적으로 개발한 독창적인 고급 알고리즘, 시안 미래 인공 지능 컴퓨팅 센터의 Shengteng AI의 강력한 컴퓨팅 성능을 결합하여 도로를 제공합니다. 네트워크 모니터링, 비상 명령, 유지 관리, 대중 교통 등 스마트 교통 시나리오는 디지털 및 지능적 변화를 가져옵니다. 교통 관리는 도시마다 특성이 다르며 도로 교통도 다릅니다.
