numpy&#s einsum 的不合理用处-Python教程-PHP中文网

首页

后端开发

Python教程

numpy&#s einsum 的不合理用处

Patricia Arquette

Nov 04, 2024 am 07:15 AM

介绍

我想向您介绍Python中最有用的方法，np.einsum。使用 np.einsum（以及 Tensorflow 和 JAX 中的对应项），您可以以极其清晰和简洁的方式编写复杂的矩阵和张量运算。我还发现它的清晰性和简洁性减轻了很多使用张量带来的精神负担。而且它实际上学习和使用起来相当简单。其工作原理如下：在 np.einsum 中，您有一个下标字符串参数，并且有一个或多个操作数：

numpy.einsum(subscripts : string, *operands : List[np.ndarray])

登录后复制

下标参数是一种“迷你语言”，它告诉 numpy 如何操作和组合操作数的轴。刚开始读起来有点困难，但是掌握窍门后也不错。

单一操作数

第一个示例，让我们使用 np.einsum 交换矩阵 A 的轴（也称为转置）：

M = np.einsum('ij->ji', A)

登录后复制

字母 i 和 j 绑定到 A 的第一个和第二个轴。Numpy 按照字母出现的顺序将字母绑定到轴，但如果你是显式的，numpy 并不关心你使用什么字母。例如，我们可以使用 a 和 b，其工作方式相同：

M = np.einsum('ab->ba', A)

登录后复制

但是，您必须提供与操作数中的轴一样多的字母。 A 中有两个轴，因此您必须提供两个不同的字母。下一个示例不会工作，因为下标公式只有一个字母要绑定，i：

# broken
M = np.einsum('i->i', A)

登录后复制

另一方面，如果操作数确实只有一个轴（即，它是一个向量），那么单字母下标公式就可以正常工作，尽管它不是很有用，因为它使向量成为原样：

m = np.einsum('i->i', a)

登录后复制

对轴求和

但是这个操作呢？右边没有 i。这有效吗？

c = np.einsum('i->', a)

登录后复制

令人惊讶的是，是的！这是理解 np.einsum 本质的第一个关键：如果一个轴从右侧省略，那么该轴对求和。 The Unreasonable Usefulness of numpy

代码：

c = 0
I = len(a)
for i in range(I):
   c += a[i]

登录后复制

求和行为不限于单个轴。例如，您可以使用以下下标公式同时对两个轴求和： c = np.einsum('ij->', A): The Unreasonable Usefulness of numpy

这是两个轴上相应的 Python 代码：

c = 0
I,J = A.shape
for i in range(I):
   for j in range(J):
      c += A[i,j]

登录后复制

但它并不止于此 - 我们可以发挥创造力，对一些轴进行求和，而忽略其他轴。例如： np.einsum('ij->i', A) 对矩阵 A 的行求和，留下长度为 j 的行和向量： The Unreasonable Usefulness of numpy

代码：

numpy.einsum(subscripts : string, *operands : List[np.ndarray])

登录后复制

同样，np.einsum('ij->j', A) 对 A 中的列进行求和。 The Unreasonable Usefulness of numpy

代码：

M = np.einsum('ij->ji', A)

登录后复制

两个操作数

我们用单个操作数可以做的事情是有限的。使用两个操作数，事情会变得更加有趣（并且有用）。假设您有两个向量 a = [a_1, a_2, ... ] 和 b = [a_1, a_2, ...]。如果 len(a) === len(b)，我们可以这样计算内积（也称为点积）：

M = np.einsum('ab->ba', A)

登录后复制

这里同时发生两件事：

因为 i 与 a 和 b 都绑定，所以 a 和 b 会“排列”然后相乘：a[i] * b[i]。
因为索引 i 被排除在右侧，所以对轴 i 进行求和以消除它。

如果将（1）和（2）放在一起，您将得到经典的内积。 The Unreasonable Usefulness of numpy

代码：

# broken
M = np.einsum('i->i', A)

登录后复制

现在，假设我们没有从下标公式中省略i，我们将所有a[i]和b[i]相乘，并且不总和除以i：

m = np.einsum('i->i', a)

登录后复制

代码：

c = np.einsum('i->', a)

登录后复制

这也称为逐元素乘法（或矩阵的哈达玛积），通常通过 numpy 方法 np.multiply 完成。下标公式还有第三种变体，称为外积。

c = 0
I = len(a)
for i in range(I):
   c += a[i]

登录后复制

在此下标公式中，a 和 b 的轴绑定到单独的字母，因此被视为单独的“循环变量”。因此，C 对于所有 i 和 j 都有条目 a[i] * b[j]，排列成矩阵。 The Unreasonable Usefulness of numpy

代码：

c = 0
I,J = A.shape
for i in range(I):
   for j in range(J):
      c += A[i,j]

登录后复制

三个操作数

将外积更进一步，这是一个三操作数版本：

I,J = A.shape
r = np.zeros(I)
for i in range(I):
   for j in range(J):
      r[i] += A[i,j]

登录后复制

我们的三操作数外积的等效 Python 代码是：

I,J = A.shape
r = np.zeros(J)
for i in range(I):
   for j in range(J):
      r[j] += A[i,j]

登录后复制

更进一步，没有什么可以阻止我们省略轴来对它们求和，除了转置通过在右侧写ki而不是ik来计算结果->:

numpy.einsum(subscripts : string, *operands : List[np.ndarray])

登录后复制

等效的 Python 代码为：

M = np.einsum('ij->ji', A)

登录后复制

现在我希望您可以开始了解如何轻松地指定复杂的张量运算。当我更广泛地使用 numpy 时，我发现每当我必须实现复杂的张量运算时，我都会使用 np.einsum。根据我的经验，np.einsum 使以后的代码阅读更加容易 - 我可以轻松地直接从下标读出上述操作：“三个向量的外积，中间轴相加，最终结果转置”。如果我必须阅读一系列复杂的 numpy 运算，我可能会发现自己张口结舌。

一个实际的例子

举一个实际的例子，让我们实现法学硕士的核心方程，来自经典论文“注意力就是你所需要的”。等式。 1 描述注意力机制： The Unreasonable Usefulness of numpy

我们将把注意力集中在这个词上

Q K^{T} QK^T

，因为 softmax 无法通过 np.einsum 和缩放因子计算

\frac{1}{\sqrt{d_{k}}} frac{1}{sqrt{d_k}}

申请起来很简单。

的 $Q K^{T} QK^T$ term 表示 m 个查询与 n 个键的点积。 Q 是 m 个 d 维行向量堆叠成矩阵的集合，因此 Q 的形状为 md。同样，K 是 n 个 d 维行向量堆叠成矩阵的集合，因此 K 的形状为 md。

单个 Q 和 K 之间的乘积可写为：

np.einsum('md,nd->mn', Q, K)

请注意，由于我们编写下标方程的方式，我们避免了在矩阵乘法之前转置 K！

The Unreasonable Usefulness of numpy

所以，这看起来非常简单 - 事实上，它只是一个传统的矩阵乘法。然而，我们还没有完成。 注意力就是你所需要的使用多头注意力，这意味着我们确实有k这样的矩阵乘法在Q矩阵和K矩阵的索引集合上同时发生.

为了让事情更清楚一些，我们可以将产品重写为 $Q_{i} K_{i}^{T} Q_iK_i^T$ .

这意味着我们对于 Q 和 K 都有一个额外的轴 i。

更重要的是，如果我们处于训练环境中，我们可能正在执行批量这样的多头注意力操作。

因此大概想要沿着批处理轴 b 对一批示例执行操作。因此，完整的产品将类似于：

numpy.einsum(subscripts : string, *operands : List[np.ndarray])

登录后复制

我将跳过这里的图表，因为我们正在处理 4 轴张量。但是您也许可以想象“堆叠”早期的图表以获得我们的多头轴 i，然后“堆叠”这些“堆栈”以获得我们的批处理轴 b。

我很难理解如何使用其他 numpy 方法的任意组合来实现这样的操作。然而，通过一些检查，就很清楚发生了什么：在一个批处理中，在矩阵 Q 和 K 的集合上，执行矩阵乘法 Qt(K).

现在，这不是很棒吗？

无耻的插头

在创始人模式磨练了一年之后，我正在找工作。我在各种技术领域和编程语言方面拥有超过 15 年的经验，并且还有管理团队的经验。数学和统计学是重点领域。 DM 我，让我们谈谈！

以上是numpy&#s einsum 的不合理用处的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

Java教程

1670

CakePHP 教程

1428

Laravel 教程

1329

PHP教程

1274

C# 教程

1256

显示更多

Related knowledge

Python与C：学习曲线和易用性 Apr 19, 2025 am 12:20 AM

Python更易学且易用，C 则更强大但复杂。1.Python语法简洁，适合初学者，动态类型和自动内存管理使其易用，但可能导致运行时错误。2.C 提供低级控制和高级特性，适合高性能应用，但学习门槛高，需手动管理内存和类型安全。

Python和时间：充分利用您的学习时间 Apr 14, 2025 am 12:02 AM

要在有限的时间内最大化学习Python的效率，可以使用Python的datetime、time和schedule模块。1.datetime模块用于记录和规划学习时间。2.time模块帮助设置学习和休息时间。3.schedule模块自动化安排每周学习任务。

Python vs.C：探索性能和效率 Apr 18, 2025 am 12:20 AM

Python在开发效率上优于C ，但C 在执行性能上更高。1.Python的简洁语法和丰富库提高开发效率。2.C 的编译型特性和硬件控制提升执行性能。选择时需根据项目需求权衡开发速度与执行效率。

学习Python：2小时的每日学习是否足够？ Apr 18, 2025 am 12:22 AM

每天学习Python两个小时是否足够？这取决于你的目标和学习方法。1)制定清晰的学习计划，2)选择合适的学习资源和方法，3)动手实践和复习巩固，可以在这段时间内逐步掌握Python的基本知识和高级功能。

Python vs. C：了解关键差异 Apr 21, 2025 am 12:18 AM

Python和C 各有优势，选择应基于项目需求。1)Python适合快速开发和数据处理，因其简洁语法和动态类型。2)C 适用于高性能和系统编程，因其静态类型和手动内存管理。

Python标准库的哪一部分是：列表或数组？ Apr 27, 2025 am 12:03 AM

pythonlistsarepartofthestAndArdLibrary，herilearRaysarenot.listsarebuilt-In，多功能，和Rused ForStoringCollections，而EasaraySaraySaraySaraysaraySaraySaraysaraySaraysarrayModuleandleandleandlesscommonlyusedDduetolimitedFunctionalityFunctionalityFunctionality。

Python：自动化，脚本和任务管理 Apr 16, 2025 am 12:14 AM

Python在自动化、脚本编写和任务管理中表现出色。1)自动化：通过标准库如os、shutil实现文件备份。2)脚本编写：使用psutil库监控系统资源。3)任务管理：利用schedule库调度任务。Python的易用性和丰富库支持使其在这些领域中成为首选工具。

Web开发的Python：关键应用程序 Apr 18, 2025 am 12:20 AM

Python在Web开发中的关键应用包括使用Django和Flask框架、API开发、数据分析与可视化、机器学习与AI、以及性能优化。1.Django和Flask框架：Django适合快速开发复杂应用，Flask适用于小型或高度自定义项目。2.API开发：使用Flask或DjangoRESTFramework构建RESTfulAPI。3.数据分析与可视化：利用Python处理数据并通过Web界面展示。4.机器学习与AI：Python用于构建智能Web应用。5.性能优化：通过异步编程、缓存和代码优

See all articles

numpy&#s einsum 的不合理用处

介绍

单一操作数

对轴求和

两个操作数

三个操作数

一个实际的例子

无耻的插头

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题