目录
回复内容:
首页 后端开发 php教程 求问交易记录这种数据量大且查询跨度大的数据库如何设计?

求问交易记录这种数据量大且查询跨度大的数据库如何设计?

Jun 06, 2016 pm 08:07 PM
linux mongodb mysql php redis

目前有个简单的交易系统,自然需要存储所有交易记录,并生成流水号啥的

目前已投入使用的有mysqlredis,如果需要的话可以加上mongodb

我设想中,交易记录流水号由当天日期+redis原子自增数组合得出

但是被交易记录表的数据库设计给难住了,因为数据量可能会很大,必须要分表甚至分库。但是又要求可以通过任意自定义时间段来查询交易记录。请问如何合理设计数据结构并保证一定的性能?

先谢过各位

回复内容:

目前有个简单的交易系统,自然需要存储所有交易记录,并生成流水号啥的

目前已投入使用的有mysqlredis,如果需要的话可以加上mongodb

我设想中,交易记录流水号由当天日期+redis原子自增数组合得出

但是被交易记录表的数据库设计给难住了,因为数据量可能会很大,必须要分表甚至分库。但是又要求可以通过任意自定义时间段来查询交易记录。请问如何合理设计数据结构并保证一定的性能?

先谢过各位

不好回答,也不建议过早考虑。
是不是可以这样理解“数据量可能会很大”,现在刚开始搞,数据量不大,但是以后备不住就成淘宝了,数据量必然很大。
其实不管是采用分表、分区、Merge引擎的方式,都是可以随时进行的,而不需要在初期就做如此长远的打算,因为你计划了也不如变化,比如典型的hash方式,你留几位?留2位,那以后数据量大了还是不够,留6位?分的表比数据都多。
而且数据量太大的时候光靠分是不行的,需要的是冗余才能提升性能,一套按user切,一套按交易时间切,如果你还想根据购买的商品查询交易记录,好的,再来一套按商品信息切。

我觉得分库是不太需要考虑的,因为你可以使用分布式文件系统玩儿集群,所谓分库其实就是把数据分成常用的,几乎不用的,压箱底的这么几个类型分开。我没分过库,此段纯属臆测。

个人看法,仅供参考,抛砖引玉。

“一套按user切,一套按交易时间切” 怎么理解?

保留最近三个月的记录,其他记录移到历史记录表,够用了

楼上说的比较实用,保留三个月的交易记录,时间到,将当前记录转移至交易历史纪录库,这样当前表的性能有保障,只不过历史数据库的数据量会很大,但使用频率并不高

如题其实你并没有实际投入使用MongoDB,不建议你为了这个再多引入一项技术,毕竟生产环境维护的工作量在那里(虽然MongoDB的维护相对来说还比较简单)。再者如果真有你说的那么大量的数据,在没有相关经验积累的情况下直接使用一项新技术基本上也是搞砸的份儿。不过既然打上了MongoDB的标签,我们也从MongoDB的角度说说理论上的实现。
先说说MongoDB实现你的需求有什么优势

  1. Sharding提供天然的大数据量支持,几个分片下来千万上亿甚至更多的数据量也不在话下。需要的时候也可以很方便地通过增加结点数量来进行水平扩展。最关键的,sharding的水平扩展对于程序来说几乎是透明的,也就是你的程序可以几乎不用考虑分库分表的问题。这点能够很方便地解决你要求的数据量问题。

  2. Tag aware sharding可以方便地解决旧数据归档问题。虽然归档对于MongoDB来说并不一定是一个必要操作,取决于片键的选取和你的查询方式。

  3. Replica Set提供天然的高可用支持,错误恢复时间可以控制在12秒以内。既然是交易系统,假设数据量有你说的这么大,那当机1秒就会损失相当可观的交易额,所以不管选择什么技术,HA必定是一个必要特性。

  4. WT支持数据压缩。虽然存储设备现在是最廉价的硬件,但是海量数据下能省下个哪怕30%也是相当可观的。

以上特性在官方文档中分别都有详细介绍,想要了解细节不妨Google一下,这里就不展开讲了。
所以说,你提的需求MongoDB基本上天然地都已经解决了,不需要很多额外的设计。除了一项关于大跨度查询交易的问题。
我的理解大跨度查询听起来像是一个OLAP需求,交易系统多数时候应该是OLTP为主。而通常情况下的OLAP都不会太在乎性能,所以你在这里要求性能似乎不太好理解。实际上也没有哪项技术能在大批量处理数据的同时还能保持“非常好”的性能,这时候只能说“足够好”或者“还凑合”。所以我感觉这个要求不太合理。更常见的一个问题应该是,如何在进行OLAP的同时不影响OLTP的性能。而这个问题也可以方便地通过配置MongoDB复制集的标签达到流量定向的目的,从而隔离OLAP和OLTP,实现互不干扰。同时复制集的不同结点可以根据OLAP和OLTP需求分别建立不同的索引,这点也为OLAP和OLTP并行提供了便利。
然后说说使用MongoDB存储交易数据会遇到的问题:

  1. 交易额通常要求精确,如果有审计方面的要求更是如此。遗憾的是目前版本的MongoDB不支持实数,这使得金额计算可能出现小额偏差,特别是在聚合运算的时候。支持实数的MongoDB可能要到下一个版本才会推出。

  2. MongoDB的群殴哲学使得MongoDB在服务器数量上远高于其他关系型数据库,成本问题不容忽视。(但在达到一定规模的情况下,也避免了使用高成本硬件如小型机,SAN存储等)

最后,如果一个新手在没有经验的情况下使用MongoDB最有可能踩的坑:

  1. 用关系范式来设计MongoDB数据库,性能灾难。

  2. 与上面相对的另一个极端,滥用schema-free。数据模型乱七八糟,极难维护。MongoDB的使用原则之一就是没有原则,程序员可以不受数据模型限制随意发挥,但一切应以使用方便,高性能为目标。有时候可能不能两全,那么要根据实际情况取舍。

  3. 选择错误的片键。这会导致出现数据量不均衡,或者写入的时候出现热分片。

  4. 好好使用索引。虽然这是一个基本功,并且对于所有数据库都适用,但是我还是经常发现程序员在写代码过程中根本不在意索引,或者不知道该建立怎样的索引。

所以如果上面的介绍勾引到你,实在想要引入MongoDB,至少先了解将会踩到的坑。

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1664
14
CakePHP 教程
1421
52
Laravel 教程
1315
25
PHP教程
1266
29
C# 教程
1239
24
怎样卸载MySQL并清理残留文件 怎样卸载MySQL并清理残留文件 Apr 29, 2025 pm 04:03 PM

要安全、彻底地卸载MySQL并清理所有残留文件,需遵循以下步骤:1.停止MySQL服务;2.卸载MySQL软件包;3.清理配置文件和数据目录;4.验证卸载是否彻底。

MySQL批量插入数据的高效方法 MySQL批量插入数据的高效方法 Apr 29, 2025 pm 04:18 PM

MySQL批量插入数据的高效方法包括:1.使用INSERTINTO...VALUES语法,2.利用LOADDATAINFILE命令,3.使用事务处理,4.调整批量大小,5.禁用索引,6.使用INSERTIGNORE或INSERT...ONDUPLICATEKEYUPDATE,这些方法能显着提升数据库操作效率。

MacOS和Linux:兼容性和用户体验 MacOS和Linux:兼容性和用户体验 Apr 30, 2025 am 12:05 AM

macOS和Linux在兼容性和用户体验上各有优势。macOS在苹果生态系统内兼容性极佳,用户体验简洁直观;Linux则在硬件兼容性和软件灵活性上表现突出,用户体验因发行版而异,强调个性化和控制。

MySQL的字符集和排序规则如何配置 MySQL的字符集和排序规则如何配置 Apr 29, 2025 pm 04:06 PM

在MySQL中配置字符集和排序规则的方法包括:1.设置服务器级别的字符集和排序规则:SETNAMES'utf8';SETCHARACTERSETutf8;SETCOLLATION_CONNECTION='utf8_general_ci';2.创建使用特定字符集和排序规则的数据库:CREATEDATABASEexample_dbCHARACTERSETutf8COLLATEutf8_general_ci;3.创建表时指定字符集和排序规则:CREATETABLEexample_table(idINT

如何使用MySQL的函数进行数据处理和计算 如何使用MySQL的函数进行数据处理和计算 Apr 29, 2025 pm 04:21 PM

MySQL函数可用于数据处理和计算。1.基本用法包括字符串处理、日期计算和数学运算。2.高级用法涉及结合多个函数实现复杂操作。3.性能优化需避免在WHERE子句中使用函数,并使用GROUPBY和临时表。

给MySQL表添加和删除字段的操作步骤 给MySQL表添加和删除字段的操作步骤 Apr 29, 2025 pm 04:15 PM

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,删除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段时,需指定位置以优化查询性能和数据结构;删除字段前需确认操作不可逆;使用在线DDL、备份数据、测试环境和低负载时间段修改表结构是性能优化和最佳实践。

session_start()函数的意义是什么? session_start()函数的意义是什么? May 03, 2025 am 12:18 AM

session_start()iscucialinphpformanagingusersessions.1)ItInitiateSanewsessionifnoneexists,2)resumesanexistingsessions,and3)setsasesessionCookieforContinuityActinuityAccontinuityAcconActInityAcconActInityAcconAccRequests,EnablingApplicationsApplicationsLikeUseAppericationLikeUseAthenticationalticationaltication and PersersonalizedContentent。

如何分析MySQL查询的执行计划 如何分析MySQL查询的执行计划 Apr 29, 2025 pm 04:12 PM

使用EXPLAIN命令可以分析MySQL查询的执行计划。1.EXPLAIN命令显示查询的执行计划,帮助找出性能瓶颈。2.执行计划包括id、select_type、table、type、possible_keys、key、key_len、ref、rows和Extra等字段。3.根据执行计划,可以通过添加索引、避免全表扫描、优化JOIN操作和使用覆盖索引来优化查询。

See all articles