与Gradio和Langchain在本地运行Olmo-2
> olmo 2:功能强大的开源LLM,用于可访问的AI
>自然语言处理领域(NLP)已经取得了迅速的进步,尤其是大型语言模型(LLMS)。尽管专有模型在历史上一直占主导地位,但开源替代方案正在迅速缩小差距。 Olmo 2代表着一个重大的飞跃,提供的性能与封闭式模型相当,同时保持完全透明度和可访问性。本文深入研究Olmo 2,探索其培训,性能和实际应用。
密钥学习点:
- 掌握了开源LLM和Olmo 2对AI研究的重要性。
- >了解Olmo 2的架构,培训方法和基准结果。
- 区分开放重量,部分打开和完全开放的模型体系结构。 学习使用Gradio和Langchain在本地学习Olmo 2。
- >使用python代码示例的Olmo 2构建聊天机器人应用程序。
- (本文是数据科学博客马拉松的一部分。) 目录的
- 表:
需要开源LLMS
介绍Olmo 2解构Olmo 2的培训>
探索Olmo 2的功能- >使用Olmo 2 构建聊天机器人
- 结论
- 常见问题
- >
- 开源LLMS
- 的需求
专有LLM的最初主导地位引起了人们对可及性,透明度和偏见的担忧。 开源LLM通过促进协作并允许进行审查,修改和改进来解决这些问题。 这种开放的方法对于推进该领域并确保公平访问LLM技术至关重要。
艾伦AI研究所(AI2)的Olmo项目举例说明了这一承诺。 Olmo 2不仅仅是简单地释放模型权重。它提供培训数据,代码,培训配方,中间检查点和指导调整的模型。这个全面的版本促进了可重复性和进一步的创新。 - 理解Olmo 2
Olmo 2在其前身OLMO-0424上显着改善。 它的7B和13B参数模型表明性能可与类似或超过类似的完全开放的模型相当,甚至可以与英语学术基准上的Llama 3.1(如Llama 3.1)相提并论,这是考虑到减少的培训拖船的显着成就。
关键改进包括:
- 实质性绩效提高:
olmo-2(7b和13b)显示出对早期Olmo模型的明显改善,表明建筑,数据或培训方法的进步。 > 与MAP-NEO-7B竞争 - :
olmo-2,尤其是13B版本,取得的分数可与Map-neo-7b相当,这是完全开放模型的强大基线。
> olmo 2的训练方法
Olmo 2的架构建立在原始Olmo上,并结合了改进的稳定性和性能。 培训过程包括两个阶段:
基础培训:
利用Olmo-Mix-1124数据集(大约3.9万亿个代币,来自不同的开源来源)来为语言理解建立强大的基础。- >
-
改进和专业化:
使用Dolmino-Mix-1124数据集,这是高质量的Web数据和特定领域的数据(学术内容,问答论坛,教学数据,数学工作簿)的精心策划组合,以完善模型的知识和技能。 “模型汤”进一步增强了最终的检查点。 - LLMS中的开放度
>由于Olmo-2是一个完全开放的模型,因此让我们澄清不同级别的模型开放度之间的区别:
>开放重量模型:
只发布模型权重。- >
- >部分打开的模型:>释放一些其他信息以外的其他信息,但不是训练过程的完整图片。 >
-
完全开放的模型:
提供完整的透明度,包括权重,培训数据,代码,配方和检查点。 这允许完全可重复性。 - 总结了关键差异的表格。>
探索和运行Olmo 2本地
> Olmo 2很容易访问。 可以提供有关下载模型和数据以及培训代码和评估指标的说明。 要在本地运行Olmo 2,请使用Ollama。 安装后,只需在命令行中运行ollama run olmo2:7b
即可。 可以通过PIP安装必要的库(Langchain和Gradio)
>使用Olmo 2 构建聊天机器人
以下Python代码演示了使用Olmo 2,Gradio和Langchain构建聊天机器人:
import gradio as gr from langchain_core.prompts import ChatPromptTemplate from langchain_ollama.llms import OllamaLLM def generate_response(history, question): template = """Question: {question} Answer: Let's think step by step.""" prompt = ChatPromptTemplate.from_template(template) model = OllamaLLM(model="olmo2") chain = prompt | model answer = chain.invoke({"question": question}) history.append({"role": "user", "content": question}) history.append({"role": "assistant", "content": answer}) return history with gr.Blocks() as iface: chatbot = gr.Chatbot(type='messages') with gr.Row(): with gr.Column(): txt = gr.Textbox(show_label=False, placeholder="Type your question here...") txt.submit(generate_response, [chatbot, txt], chatbot) iface.launch()
结论 Olmo 2
代表对开源LLM生态系统的重要贡献。 它的强大性能以及其完整的透明度,使其成为研究人员和开发人员的宝贵工具。 尽管在所有任务中都不是普遍优越,但其开放性质却促进了协作,并加速了可访问且透明的AI领域的进步。
钥匙要点:
- > olmo-2的13B参数模型在各种基准上展示了出色的性能,超过其他开放型号。
- 完整的模型开放性促进了更有效模型的开发。
- >常见问题(常见问题解答)
(注意:图像URL保持不变。)
>
以上是与Gradio和Langchain在本地运行Olmo-2的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

本文回顾了AI最高的艺术生成器,讨论了他们的功能,对创意项目的适用性和价值。它重点介绍了Midjourney是专业人士的最佳价值,并建议使用Dall-E 2进行高质量的可定制艺术。

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

本文比较了诸如Chatgpt,Gemini和Claude之类的顶级AI聊天机器人,重点介绍了其独特功能,自定义选项以及自然语言处理和可靠性的性能。

Chatgpt 4当前可用并广泛使用,与诸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和产生连贯的响应方面取得了重大改进。未来的发展可能包括更多个性化的间

文章讨论了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的写作助手,重点介绍了其独特的内容创建功能。它认为Jasper在SEO优化方面表现出色,而AI工具有助于保持音调的组成

2024年见证了从简单地使用LLM进行内容生成的转变,转变为了解其内部工作。 这种探索导致了AI代理的发现 - 自主系统处理任务和最少人工干预的决策。 Buildin

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

本文评论了Google Cloud,Amazon Polly,Microsoft Azure,IBM Watson和Discript等高级AI语音生成器,重点介绍其功能,语音质量和满足不同需求的适用性。
