- 分类:
- 人工智能
-
- 人类没有足够的高质量语料给AI学了,2026年就用尽,网友:大型人类文本生成项目启动!
- AI胃口太大,人类的语料数据已经不够吃了。来自Epoch团队的一篇新论文表明,AI不出5年就会把所有高质量语料用光。要知道,这可是把人类语言数据增长率考虑在内预测出的结果,换而言之,这几年人类新写的论文、新编的代码,哪怕全都喂给AI也不够。照这么发展下去,依赖高质量数据提升水平的语言大模型,很快就要迎来瓶颈。已经有网友坐不住了:这太荒谬了。人类无需阅读互联网所有内容,就能高效训练自己。我们需要更好的模型,而不是更多的数据。还有网友调侃,都这样了不如让AI吃自己吐的东西:可以把AI自己生成的文本当
- 人工智能 . 科技周边 1539 2023-04-16 17:49:03
-
- 深度学习又有新坑了!悉尼大学提出全新跨模态任务,用文本指导图像进行抠图
- 图像抠图是指提取图像中准确的前景。当前的自动方法倾向于不加区别地提取图像中的所有显著对象。在本文中,作者提出了一个新的任务称为参考图像抠图(ReferringImageMatting,RIM),指的是提取特定对象的细致的alpha抠图,它可以最好地匹配给定的自然语言描述。然而,流行的visualgrounding方法都局限于分割水平,可能是由于缺乏高质量的RIM数据集。为了填补这一空白,作者通过设计一个全面的图像合成和表达生成引擎,建立了第一个大规模挑战性数据集RefMatte,以在当前公
- 人工智能 . 科技周边 1753 2023-04-16 17:46:03
-
- 十个机器学习中常用的距离度量方法
- 距离度量是有监督和无监督学习算法的基础,包括k近邻、支持向量机和k均值聚类等。距离度量的选择影响我们的机器学习结果,因此考虑哪种度量最适合这个问题是很重要的。因此,我们在决定使用哪种测量方法时应该谨慎。但在做出决定之前,我们需要了解距离测量是如何工作的,以及我们可以从哪些测量中进行选择。本文将简要介绍常用的距离度量方法、它们的工作原理、如何用Python计算它们以及何时使用它们。这样可以加深知识和理解,提高机器学习算法和结果。在更深入地研究不同的距离测量之前,我们先要有一个关于它们如何工作以及如
- 人工智能 . 科技周边 1861 2023-04-16 17:19:03
-
- OpenAI超级对话模型ChatGPT发布!智能回答堪比雅思口语满分案例
- 当人们翘首期待GPT-4时,OpenAI在11月的最后一天给大家带来了一个彩蛋。优化对话的语言模型最近,OpenAI训练了一个名为ChatGPT的模型,它以对话方式进行交互。对话格式使ChatGPT可以回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。ChatGPT是InstructGPT的兄弟模型,它经过训练可以按照提示中的说明进行操作并提供详细的响应。目前,OpenAI将ChatGPT免费开放给大众使用,以获取用户的反馈,为后续改进做好准备。OpenAI使用强化学习(RLHF)训
- 人工智能 . 科技周边 1340 2023-04-16 15:37:03
-
- 人工智能和大数据是工业4.0背后的驱动力
- 理解大数据和人工智能在我们的数据驱动世界中的作用非常关键。在任何人知道大数据存在之前,它就已经席卷了全球。到这个词被创造出来时,大数据已经积累了大量的存储信息。如果利用得当,它可能会提供有关特定数据所属领域的深刻知识。对所有数据进行分类、解析(将其转换为计算机更容易理解的格式)以及分析数据以增强商业决策过程的任务很快被发现,人类的大脑无法处理。要完成从复杂数据中提取知识的艰巨任务,必须使用人工智能编写算法。理解大数据和人工智能在我们的数据驱动世界中的作用尤为关键。随着企业在未来几年扩大他们的大数
- 人工智能 . 科技周边 1497 2023-04-16 15:31:03
-
- 人工智能:声纹相关基础概念介绍
- 今天给大家聊聊声纹相关的基础概念知识,希望对大家有所帮助!1、声纹的概念现实生活中大家可能比较常见的是指纹识别,比较常见的使用场景有手机指纹识别、智能门指纹识别等方面,那么什么是声纹呢?声纹其实可以指纹的用途类似都是为了区分出和其他人不同的特征。简单来说就是将某个人的声音可以和其他人区分开来的特征。2、声纹识别介绍声纹识别属于生物识别技术的一种,也是语音识别技术的一个门类。声纹识别主要包括声纹注册和声纹鉴别两个过程。简单来说声纹识别就是把人的声信号转换为电信号,然后进行特征提取、建模、最后进行匹
- 人工智能 . 科技周边 2074 2023-04-16 15:16:03
-
- 美国防部召集微软研究实用规模量子计算 意在抢占全球领导地位
- 2月3日据报道,美国国防部高级研究计划局(DARPA)计划与微软合作,研究如何实现实用规模(utility-scale)的量子计算,致力寻求在量子技术方面占据全球领导地位。微软是被该部门选为探索非主流量子计算解决方案的三家公司之一。分析师表示合作开发大规模量子计算项目将是实现量子技术长期潜力的关键。开发量子计算的几种技术路线开发量子计算有很多种方法,目前还不清楚哪一种方法在未来几十年中占据主导地位。这场竞赛是为了实现可持续的、可扩展的容错处理,以完成传统超级计算机不可能完成或不可行的计算任务。D
- 人工智能 . 科技周边 1446 2023-04-16 14:55:03
-
- 图灵机:在没有计算机的时候,我们如何谈论计算?
- 1950年10月,一篇题为“机器能思考吗”的论文横空出世。这篇论文中提出了一个令人细思极恐的测试,即在测试者与被测试者(一个真人和一台机器)隔开的情况下,通过通讯装置向被测试者随意提问,并让测试者猜测与自己对话的对方到底是真人还是机器。在多次测试后,如果机器能平均让每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。人们第一次意识到机器人可能具备人类智能,便是从此开始。这个测试便是令千万科幻爱好者津津乐道的图灵测试。这篇文章也为作者AlanTuring(艾伦·图灵)赢
- 人工智能 . 科技周边 1692 2023-04-16 14:34:03
-
- 微软摒弃元宇宙拥抱人工智能意味着什么?
- 就在两年前,微软高管还在极力称赞元宇宙是改变游戏规则的事物,就像他们现在谈论ChatGPT一样。在OpenAI推出的ChatGPT风靡全球之前,很多人认为元宇宙将成为下一个大事件,并将以前所未有的方式改变世界、技术和工作方式。一些专家表示,人们很快将在虚拟世界中共同生活和工作,那里比现实世界更有趣、更有活力、更富有成效。马克·扎克伯格为此将Facebook更名为Meta,而微软也大肆宣传元宇宙。特别是该公司CEO萨蒂亚·纳德拉两年前在MicrosoftIgnite大会的主题演讲中说:“元宇宙是一
- 人工智能 . 科技周边 1246 2023-04-16 14:22:07
-
- 训练深度学习神经网络的常用五个损失函数
- 神经网络在训练时的优化首先是对模型的当前状态进行误差估计,然后为了减少下一次评估的误差,需要使用一个能够表示错误函数对权重进行更新,这个函数被称为损失函数。损失函数的选择与神经网络模型从示例中学习的特定预测建模问题(例如分类或回归)有关。在本文中我们将介绍常用的一些损失函数,包括:回归模型的均方误差损失二元分类模型的交叉熵和hinge损失回归模型的损失函数回归预测模型主要是用来预测连续的数值。所以我们将使用scikit-learn的make_regression()函数来生成一些模拟数据,并使用
- 人工智能 . 科技周边 1744 2023-04-16 14:16:03
-
- 还不如GAN!谷歌、DeepMind等发文:扩散模型直接从训练集里「抄」
- 去年,图像生成模型大火,在一场大众艺术狂欢后,接踵而来的还有版权问题。类似DALL-E2,Imagen和StableDiffusion等深度学习模型的训练都是在上亿的数据上进行训练的,根本无法摆脱训练集的影响,但是否某些生成的图像就完全来自于训练集?如果生成图像与原图十分类似的话,其版权又归谁所有?最近来自谷歌、Deepmind、苏黎世联邦理工学院等多所知名大学和企业的研究人员们联合发表了一篇论文,他们发现扩散模型确实可以记住训练集中的样本,并在生成过程中进行复现。论文链接:https://a
- 人工智能 . 科技周边 1430 2023-04-16 14:10:03
-
- 无需人工标注,自生成指令框架打破ChatGPT等LLM的成本瓶颈
- ChatGPT是今年年底AI圈的新晋顶流,人们惊叹于它强大的问答语言能力和掌握的编程知识。但越是强大的模型,其背后的技术要求也就越高。ChatGPT是在GPT3.5系列模型的基础上,引入「人工标注数据+强化学习」(RLHF)来不断微调预训练语言模型,旨在让大型语言模型(LLM)学会理解人类的命令,并学会根据给定的prompt给出最优的答案。这种技术思路是当前语言模型的发展趋势。这类模型虽然很有发展前景的,但模型训练和微调所需的成本非常高。根据OpenAI目前公开的信息,Chat
- 人工智能 . 科技周边 1431 2023-04-16 13:52:03
-
- 腾讯发布新一代超强算力集群:面向大模型训练,性能提升 3 倍
- 新一代HCC高性能计算集群,采用最新一代星星海自研服务器,搭载英伟达H800TensorCoreGPU。腾讯官方称,该集群基于自研网络、存储架构,带来3.2T超高互联带宽、TB级吞吐能力和千万级IOPS。实测结果显示,新一代集群算力性能较前代提升3倍。去年10月,腾讯完成首个万亿参数的AI大模型——混元NLP大模型训练。在同等数据集下,将训练时间由50天缩短到11天。如果基于新一代集群,训练时间将进一步缩短至4天。计算层面,服务器单机性能是集群算力的基础
- 人工智能 . 科技周边 1327 2023-04-16 13:28:05
-
- RPA如何推动企业的生产力
- 广告技术平台提供商Omneky公司的创始人兼首席执行官HikariSenju表示,2020年爆发的新冠疫情迫使很多企业通过自动化技术简化流程。他认为,人们普遍预期的经济衰退将使机器人流程自动化(RPA)进一步受到关注。他说,“在新冠疫情持续蔓延期间,已经证明某些流程是低效的,可以通过技术更好地实现自动化。2023年即将到来的经济衰退迫使企业进入成本削减模式,从而加速采用RPA。”在Senju看来,采用RPA和自动化将使企业在竞争中保持领先地位,并适应不断变化的市场。当然,其前提是RPA实施得当。
- 人工智能 . 科技周边 1313 2023-04-16 12:43:03
-
- Meta AI开放6亿+宏基因组蛋白质结构图谱,150亿语言模型用两周完成
- 今年,DeepMind公布了大约2.2亿种蛋白质的预测结构,它几乎涵盖了DNA数据库中已知生物体的所有蛋白质。现在,另一家科技巨头Meta正在填补另一空白,微生物领域。简单来说,Meta使用AI技术预测了约6亿种蛋白质结构,这些蛋白质来自细菌和其他尚未被表征的微生物。团队负责人AlexanderRives表示:「这些蛋白质是我们所知最少的结构,它们是非常神秘的蛋白质。我认为这些发现为深入了解生物学提供了潜力。」通常,语言模型是在大量文本上进行训练的。Meta为了将语言模型应
- 人工智能 . 科技周边 1911 2023-04-16 11:37:02
PHP讨论组
组员:3305人话题:1500
PHP一种被广泛应用的开放源代码的多用途脚本语言,和其他技术相比,php本身开源免费; 可以将程序嵌入于HTML中去执行, 执行效率比完全生成htmL标记的CGI要高许多,它运行在服务器端,消耗的系统资源相当少,具有跨平台强、效率高的特性,而且php支持几乎所有流行的数据库以及操作系统,最重要的是


