如何将 Pandas DataFrame 列分解为多行?
如何将 Pandas DataFrame 中的列取消嵌套(分解)为多行
在 Pandas 中,分解列涉及将数据从单行转换为多行。当您有一列包含列表类型单元格并且需要将它们拆分为单独的行时,这非常有用。
考虑一个包含列表“B”列的 DataFrame:
df = pd.DataFrame({'A': [1, 2], 'B': [[1, 2], [1, 2]]}) Output: A B 0 1 [1, 2] 1 2 [1, 2]
到爆炸这列“B”,我们提出了各种方法:
方法 0 [Pandas >= 0.25]
从 Pandas 0.25 开始,如果只需要爆炸一列,请使用 pandas.DataFrame.explode 函数:
df.explode('B') Output: A B 0 1 1 1 1 2 3 2 1 4 2 2
方法 1
应用pd.Series(容易理解,但不推荐性能):
df.set_index('A').B.apply(pd.Series).stack().reset_index(level=0).rename(columns={0:'B'})
方法 2
在 DataFrame 构造函数中使用重复:
df = pd.DataFrame({'A': df.A.repeat(df.B.str.len()), 'B': np.concatenate(df.B.values)})
方法 3
Re -创建list:
pd.DataFrame([[x] + [z] for x, y in df.values for z in y], columns=df.columns)
方法 4
使用 reindex 或 loc:
df.reindex(df.index.repeat(df.B.str.len())).assign(B=np.concatenate(df.B.values))
方法 5
当列表仅包含唯一的值:
from collections import ChainMap d = dict(ChainMap(*map(dict.fromkeys, df['B'], df['A']))) pd.DataFrame(list(d.items()), columns=df.columns[::-1])
方法 6
使用 NumPy 实现高性能:
newvalues = np.dstack((np.repeat(df.A.values, list(map(len, df.B.values))), np.concatenate(df.B.values))) pd.DataFrame(data=newvalues[0], columns=df.columns)
方法 7
使用 itertools循环和chain:
from itertools import cycle, chain l = df.values.tolist() l1 = [list(zip([x[0]], cycle(x[1])) if len([x[0]]) > len(x[1]) else list(zip(cycle([x[0]]), x[1]))) for x in l] pd.DataFrame(list(chain.from_iterable(l1)), columns=df.columns)
泛化为多列
要处理多个爆炸列,可以定义一个函数:
def unnesting(df, explode): idx = df.index.repeat(df[explode[0]].str.len()) df1 = pd.concat([ pd.DataFrame({x: np.concatenate(df[x].values)}) for x in explode], axis=1) df1.index = idx return df1.join(df.drop(explode, 1), how='left') unnesting(df, ['B', 'C'])
Column-明智的取消嵌套
要水平扩展列表,请使用 pd.DataFrame构造函数:
df.join(pd.DataFrame(df.B.tolist(), index=df.index).add_prefix('B_'))
以上是如何将 Pandas DataFrame 列分解为多行?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

使用FiddlerEverywhere进行中间人读取时如何避免被检测到当你使用FiddlerEverywhere...

如何在10小时内教计算机小白编程基础?如果你只有10个小时来教计算机小白一些编程知识,你会选择教些什么�...

攻克Investing.com的反爬虫策略许多人尝试爬取Investing.com(https://cn.investing.com/news/latest-news)的新闻数据时,常常�...

Python3.6环境下加载pickle文件报错:ModuleNotFoundError:Nomodulenamed...

使用Scapy爬虫时管道文件无法写入的原因探讨在学习和使用Scapy爬虫进行数据持久化存储时,可能会遇到管道文�...
