扫码关注官方订阅号
如果有一个大数据量的文本文件,每行一个字符串,如何用java对该文件进行排序并且去重?
人生最曼妙的风景,竟是内心的淡定与从容!
关键还是看数据量大小,
如果可以在内存里,直接用 java.util.TreeSet 就解决了。
java.util.TreeSet
如果数据量特别大,不适合直接在内存里处理,又不想自己写太复杂的算法,就用临时文件,分段缓存,先保证唯一性,再对每一段进行排序,最后组合起来。更简单的一点的办法就是用数据库,比如 SQLite,全部插入,排序,去重,处理起来都比较简单了。
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
关键还是看数据量大小,
如果可以在内存里,直接用
java.util.TreeSet
就解决了。如果数据量特别大,不适合直接在内存里处理,又不想自己写太复杂的算法,就用临时文件,分段缓存,先保证唯一性,再对每一段进行排序,最后组合起来。更简单的一点的办法就是用数据库,比如 SQLite,全部插入,排序,去重,处理起来都比较简单了。