英伟达64个A100训练StyleGAN-T；九类生成式AI模型综述-人工智能-PHP中文网

首页

科技周边

人工智能

英伟达64个A100训练StyleGAN-T；九类生成式AI模型综述

PHPz

Apr 11, 2023 pm 12:13 PM

ai 模型

目录：

Quantum machine learning beyond kernel methods
Wearable in-sensor reservoir computing using optoelectronic polymers with through-space charge-transport characteristics for multi-task learning
Dash: Semi-Supervised Learning with Dynamic Thresholding
StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-Image Synthesis
Open-Vocabulary Multi-Label Classification via Multi-Modal Knowledge Transfer
ChatGPT is not all you need. A State of the Art Review of large Generative AI models
ClimaX: A foundation model for weather and climate
ArXiv Weekly Radiostation：NLP、CV、ML 更多精选论文（附音频）

论文 1：Quantum machine learning beyond kernel methods

作者：Sofiene Jerbi 等
论文地址：https://www.nature.com/articles/s41467-023-36159-y

摘要：本文中，来自奥地利因斯布鲁克大学的研究团队确定了一个建设性框架，该框架捕获所有基于参数化量子电路的标准模型：线性量子模型。

研究人员展示了使用量子信息论中的工具如何将数据重新上传电路有效地映射到量子希尔伯特空间中线性模型的更简单图像中。此外，根据量子比特数和需要学习的数据量来分析这些模型的实验相关资源需求。基于经典机器学习的最新结果，证明线性量子模型必须使用比数据重新上传模型多得多的量子比特才能解决某些学习任务，而核方法还需要多得多的数据点。

研究结果提供了对量子机器学习模型的更全面的了解，以及对不同模型与 NISQ 约束的兼容性的见解。

这项工作中研究的量子机器学习模型。

推荐：超越核方法的量子机器学习，量子学习模型的统一框架。

论文 2：Wearable in-sensor reservoir computing using optoelectronic polymers with through-space charge-transport characteristics for multi-task learning

作者：Xiaosong Wu 等
论文地址：https://www.nature.com/articles/s41467-023-36205-9

摘要：传感器内多任务学习不仅是生物视觉的关键优点，也是人工智能的主要目标。然而，传统的硅视觉芯片存在大量时间以及能量开销。此外，训练传统的深度学习模型在边缘设备上既不可扩展也不可负担。

本文中，中科院和香港大学的研究团队提出了一种材料算法协同设计来模拟人类视网膜的学习范例，并且低开销。基于具有有效激子解离和贯穿空间电荷传输特性的瓶刷形半导体 p-NDI，开发了一种基于可穿戴晶体管的动态传感器储层计算系统，该系统在不同任务上表现出优异的可分离性、衰减记忆和回波状态特性。

与忆阻有机二极管上的「读出功能」相结合，RC 可识别手写字母和数字，并对各种服装进行分类，准确率分别为 98.04%、88.18% 和 91.76%（高于所有已报告的有机半导体）。

传统半导体和 p-NDI 的光电流响应比较，以及传感器内 RC 系统的详细半导体设计原理。

推荐：低能耗低时耗，中科院 & 香港大学团队使用新方法进行多任务学习的可穿戴传感器内储层计算。

论文 3：Dash: Semi-Supervised Learning with Dynamic Thresholding

作者：Yi Xu 等
论文地址：https://proceedings.mlr.press/v139/xu21e/xu21e.pdf

摘要：这篇论文创新性地提出用动态阈值（dynamic threshold）的方式筛选无标签样本进行半监督学习（semi-supervised learning，SSL）的方法，我们改造了半监督学习的训练框架，在训练过程中对无标签样本的选择策略进行了改进，通过动态变化的阈值来选择更有效的无标签样本进行训练。Dash 是一个通用策略，可以轻松与现有的半监督学习方法集成。

实验方面，我们在 CIFAR-10、CIFAR-100、STL-10 和 SVHN 等标准数据集上充分验证了其有效性。理论方面，论文从非凸优化的角度证明了 Dash 算法的收敛性质。

Fixmatch 训练框架

推荐：达摩院开源半监督学习框架 Dash，刷新多项 SOTA。

论文 4：StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-Image Synthesis

作者：Axel Sauer 等
论文地址：https://arxiv.org/pdf/2301.09515.pdf

摘要：扩散模型在文本到图像生成方面是最好的吗？不见得，英伟达等推出的新款 StyleGAN-T，结果表明 GAN 仍具有竞争力。StyleGAN-T 只需 0.1 秒即可生成 512×512 分辨率图像：

推荐：GAN 强势归来？英伟达耗费 64 个 A100 训练 StyleGAN-T，优于扩散模型。

论文 5：Open-Vocabulary Multi-Label Classification via Multi-Modal Knowledge Transfer

作者：Sunan He 等
论文地址：https://arxiv.org/abs/2207.01887

摘要：在多标签分类系统中，经常遇到大量在训练集中未曾出现的标签，如何准确地识别这些标签是非常重要也极富挑战性的问题。

为此，腾讯优图实验室联合清华大学和深圳大学，提出了一种基于多模态知识迁移的框架 MKT，利用图文预训练模型强大的图文匹配能力，保留图像分类中关键的视觉一致性信息，实现多标签场景的 Open Vocabulary 分类。本工作已入选 AAAI 2023 Oral。

ML-ZSL 和 MKT 方法比较。

推荐：AAAI 2023 Oral | 如何识别未知标签？多模态知识迁移框架实现新 SOTA。

论文 6：ChatGPT is not all you need. A State of the Art Review of large Generative AI models

作者：Roberto Gozalo-Brizuela 等
论文地址：https://arxiv.org/abs/2301.04655

摘要：过去两年，AI 领域里已经出现大量大型生成模型，如 ChatGPT 或 Stable Diffusion。具体而言，这些模型能够执行像通用问答系统或自动创建艺术图像等任务，这些任务正在彻底改变很多领域。

在近日由西班牙 Comillas Pontifical University 研究人员提交的综述论文中，作者试图以简洁的方式描述生成式 AI 对当前很多模型的影响，并对最近发布的主要生成式 AI 模型进行分类。

分类图示。

推荐：ChatGPT is not all you need，一文综述 6 大公司 9 类生成式 AI 模型。

论文 7：ClimaX: A foundation model for weather and climate

作者：Tung Nguyen 等
论文地址：https://arxiv.org/abs/2301.10343

摘要：微软自主系统与机器人研究小组以及微软研究院科学智能中心开发了 ClimaX，这是一种灵活且可推广的天气和气候科学深度学习模型，可以使用跨越不同变量、时空覆盖和物理基础的异构数据集进行训练。

ClimaX 使用新颖的编码和聚合块扩展了 Transformer 架构，这些块允许有效使用可用计算，同时保持通用性。ClimaX 在源自 CMIP6 的气候数据集上使用自我监督学习目标进行了预训练。然后可以对预训练的 ClimaX 进行微调，以解决广泛的气候和天气任务，包括那些涉及预训练期间看不到的大气变量和时空尺度的任务。

预训练期间使用的 ClimaX 架构

推荐：微软团队发布第一个基于 AI 的天气和气候基础模型 ClimaX。

以上是英伟达64个A100训练StyleGAN-T；九类生成式AI模型综述的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

Java教程

1666

CakePHP 教程

1425

Laravel 教程

1327

PHP教程

1273

C# 教程

1253

显示更多

Related knowledge

C 中的chrono库如何使用？ Apr 28, 2025 pm 10:18 PM

使用C 中的chrono库可以让你更加精确地控制时间和时间间隔，让我们来探讨一下这个库的魅力所在吧。C 的chrono库是标准库的一部分，它提供了一种现代化的方式来处理时间和时间间隔。对于那些曾经饱受time.h和ctime折磨的程序员来说，chrono无疑是一个福音。它不仅提高了代码的可读性和可维护性，还提供了更高的精度和灵活性。让我们从基础开始，chrono库主要包括以下几个关键组件：std::chrono::system_clock：表示系统时钟，用于获取当前时间。std::chron

如何理解C 中的DMA操作？ Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess，直接内存访问技术，允许硬件设备直接与内存进行数据传输，不需要CPU干预。1)DMA操作高度依赖于硬件设备和驱动程序，实现方式因系统而异。2)直接访问内存可能带来安全风险，需确保代码的正确性和安全性。3)DMA可提高性能，但使用不当可能导致系统性能下降。通过实践和学习，可以掌握DMA的使用技巧，在高速数据传输和实时信号处理等场景中发挥其最大效能。

怎样在C 中处理高DPI显示？ Apr 28, 2025 pm 09:57 PM

在C 中处理高DPI显示可以通过以下步骤实现：1)理解DPI和缩放，使用操作系统API获取DPI信息并调整图形输出；2)处理跨平台兼容性，使用如SDL或Qt的跨平台图形库；3)进行性能优化，通过缓存、硬件加速和动态调整细节级别来提升性能；4)解决常见问题，如模糊文本和界面元素过小，通过正确应用DPI缩放来解决。

C 中的实时操作系统编程是什么？ Apr 28, 2025 pm 10:15 PM

C 在实时操作系统（RTOS）编程中表现出色，提供了高效的执行效率和精确的时间管理。1）C 通过直接操作硬件资源和高效的内存管理满足RTOS的需求。2）利用面向对象特性，C 可以设计灵活的任务调度系统。3）C 支持高效的中断处理，但需避免动态内存分配和异常处理以保证实时性。4）模板编程和内联函数有助于性能优化。5）实际应用中，C 可用于实现高效的日志系统。

给MySQL表添加和删除字段的操作步骤 Apr 29, 2025 pm 04:15 PM

在MySQL中，添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column，删除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段时，需指定位置以优化查询性能和数据结构；删除字段前需确认操作不可逆；使用在线DDL、备份数据、测试环境和低负载时间段修改表结构是性能优化和最佳实践。

怎样在C 中测量线程性能？ Apr 28, 2025 pm 10:21 PM

在C 中测量线程性能可以使用标准库中的计时工具、性能分析工具和自定义计时器。1.使用库测量执行时间。2.使用gprof进行性能分析，步骤包括编译时添加-pg选项、运行程序生成gmon.out文件、生成性能报告。3.使用Valgrind的Callgrind模块进行更详细的分析，步骤包括运行程序生成callgrind.out文件、使用kcachegrind查看结果。4.自定义计时器可灵活测量特定代码段的执行时间。这些方法帮助全面了解线程性能，并优化代码。

量化交易所排行榜2025 数字货币量化交易APP前十名推荐 Apr 30, 2025 pm 07:24 PM

交易所内置量化工具包括：1. Binance（币安）：提供Binance Futures量化模块，低手续费，支持AI辅助交易。2. OKX（欧易）：支持多账户管理和智能订单路由，提供机构级风控。独立量化策略平台有：3. 3Commas：拖拽式策略生成器，适用于多平台对冲套利。4. Quadency：专业级算法策略库，支持自定义风险阈值。5. Pionex：内置16 预设策略，低交易手续费。垂直领域工具包括：6. Cryptohopper：云端量化平台，支持150 技术指标。7. Bitsgap：