首页 >数据库 >mysql教程 > 正文

在 MySQL 中,如何计算一组数据的中位数

转载2019-09-12 11:08:5301110
要得到一组数据的中位数(例如某个地区或某家公司的收入中位数),我们一般要将这一任务细分为 3 个小任务:

1.将数据排序,并给每一行数据给出其在所有数据中的排名;

2.找出中位数的排名数字;

3.找出中间排名对应的值;

下面以某公司员工月收入为例,示例 MySQL 的一些复杂语句的使用。

方法一

创建测试表

首先创建一个收入表,建表语句为:

CREATE TABLE IF NOT EXISTS `employee` (
  `id`     INT                  AUTO_INCREMENT PRIMARY KEY,
  `name`   VARCHAR(10) NOT NULL DEFAULT '',
  `income` INT         NOT NULL DEFAULT '0'
)
  ENGINE = InnoDB
  DEFAULT CHARSET = utf8;
INSERT INTO `employee` (`name`, `income`)
VALUES ('麻子', 20000);
INSERT INTO `employee` (`name`, `income`)
VALUES ('李四', 12000);
INSERT INTO `employee` (`name`, `income`)
VALUES ('张三', 10000);
INSERT INTO `employee` (`name`, `income`)
VALUES ('王二', 16000);
INSERT INTO `employee` (`name`, `income`)
VALUES ('土豪', 40000);

完成任务 1

将数据排序,并给每一行数据给出其在所有数据中的排名:

SELECT t1.name, t1.income, COUNT(*) AS rank
FROM employee AS t1,
     employee AS t2
WHERE t1.income < t2.income
   OR (t1.income = t2.income AND t1.name <= t2.name)
GROUP BY t1.name, t1.income
ORDER BY rank;

查询结果为:

492a81f0598eb5622f488d41ac30bdf.png

完成小任务 2

找出中位数的排名数字:

SELECT (COUNT(*) + 1) DIV 2 as rank
FROM employee;

查询结果为:

210205328ff0784952f3dfa5b67f612.png

完成小任务 3

SELECT income AS median
FROM (SELECT t1.name, t1.income, COUNT(*) AS rank
      FROM employee AS t1,
           employee AS t2
      WHERE t1.income < t2.income
         OR (t1.income = t2.income AND t1.name <= t2.name)
      GROUP BY t1.name, t1.income
      ORDER BY rank) t3
WHERE rank = (SELECT (COUNT(*) + 1) DIV 2 FROM employee)

查询结果为:

835e75d07d4ffd52a5482c8a08e89f3.png

至此,我们就找到了如何从一组数据中获得中位数的方法。

方法二

下面,来介绍另外一种优化排名语句的方法。

我们都知道如何给一组数据做排序操作,在本例中,实现方法如下:

SELECT name, income
FROM employee
ORDER BY income DESC

查询结果为:

f5b6fd78598104e12fb46a8db24c6ed.png

那我们可不可以更进一步,对查询出的结果加一列,这一列的数据为排名呢?

我们可以通过 3 个自定义变量的方法来实现这一目标:

第一个变量用来记录当前行数据的收入

第二个变量用来记录上一行数据的收入

第三个变量用来记录当前行数据的排名

SET @curr_income := 0;
SET @prev_income := 0;
SET @rank := 0;
SELECT `name`,
       @curr_income := income                                      AS income,
       @rank := if(@prev_income != @curr_income, @rank + 1, @rank) AS rank,
       @prev_income := @curr_income                                AS dummy
FROM employee
ORDER BY income DESC

查询结果如下:

e755927d76f35a4d443d9fed3c4b927.png

然后再找出中位数的排名数字,进一步找出收入的中位数:

SET @curr_income := 0;
SET @prev_income := 0;
SET @rank := 0;
SELECT income AS median
FROM (SELECT `name`,
             @curr_income := income                                      AS income,
             @rank := if(@prev_income != @curr_income, @rank + 1, @rank) AS rank,
             @prev_income := @curr_income                                AS dummy
      FROM employee
      ORDER BY income DESC) AS t1
WHERE t1.rank = (SELECT (COUNT(*) + 1) DIV 2 FROM employee)

查询结果为:

203ebad79cbd1463414c89cf3b5b959.png

至此,我们找了两种方法来解决中位数的问题。撒花。

推荐:《mysql教程

以上就是在 MySQL 中,如何计算一组数据的中位数的详细内容,更多请关注php中文网其它相关文章!

php中文网最新课程二维码
  • 相关标签:MySQL
  • 本文转载于:learnku,如有侵犯,请联系a@php.cn删除
  • 相关文章

    相关视频


    网友评论

    文明上网理性发言,请遵守 新闻评论服务协议

    我要评论
  • php指定置插入单元方法是:使用“array_splice(array,offset,length,array)”方法,其,参array和offset为必须参,参length为可选参
    机容量基本单是:字节。字节是基本存储单,比特是最小存储单大多机系统个字节是个8,大多机用个字节表示个字符、字或其他字符。
    存储,存储基本单是字节(Byte),最小单(bit)。8个bit个Byte(字节),能够容纳个英文字符,不过个汉字需要两个字节存储空间。
    域名与IP地址对应。域名又称网域,是由串用点分隔名字Internet上某机或名称,用于传输时对标识(有时也指地理置)。
    抽象类型是指学模型及定义该模型上操作,它仅取决于其逻辑特征,而与机内部表示和实现无关,体现了程序设问题分解和信息隐藏特征。
    信息保存基本形式是:二进制。所有信息都是以“二进制”形式存储电脑内部
    标准ASCII码个字节存储量,最高为“0”。,所有存储和运时都要使用二进制表示。
    常用单:1、(比特bit),机最小。2、字节(Byte),8个二进制构成个字节。3、KB:1KB代表1024个字节。4、MB。
    字符是指使用字母、字、字和符号,字符是结构最小存取单,通常由8个二进制来表示个字符;字符串是由字、字母、下划线串字符,是编程语言表示文本类型。
    衡量机存储器容量基本单是字节,字节是机信息技术用于量存储容量量单,也表示机编程语言类型和语言字符,节存储8无符号,储存值范围为“0-255”。
    机系统个字节是个8,大多机用个字节表示个字符、字或其他字符。ASCII码:个英文字母(不分大小写)占个字节空间。
    excel竖向平均值方法是:1、找到需要平均值;2、将光标定单元格下方;3、输入公式【AVERAGE()】;4、选单元格,回车即可。
    excel表格乘法方法:首先打开excel,并输入两;然后选定,并点击“函”按钮;接着弹出菜单点击“其他函”选项,并插入函页面选择“乘积”;最后点击确定即可乘法
    internet上域名和ip地址之间关系是个IP地址对应多个域名,而域名由串用点分隔名字Internet上某机或名称,用于传输时标识电子方
    机处理带有小,小通常有两种表示方法,种是约定所有点隐含个固定置上,称为定点表示法,简称定点;另种是小置可以浮动,称为浮点表示法,简称浮点
    RAID5和RAID3之间区别于RAID5不会将所有检查块存储专用检查磁盘,而是将它们分布所有磁盘上。 RAID 5使用特殊条带检查块存储置。
    行称为记录;列称为字段。库是“按照结构来织、存储和管理仓库”;是个长期存储机内、有、可共享、统管理大量集合。
    机病毒发作时,主要造成破坏是:对存储硬盘上程序、甚至系统损坏。
    excel自动年龄方法是:1、首先表格输入基本信息,姓名、出生日期等;2、然后选年龄这列,点击【设置单元格格式】,点击【字】选项,选值】,将小修改为0;3、最后使用公式年龄即可
    C语言操作  复学运十分重要,编写值运或者时候,我们会用到复这种概念。那么,复C/C++语言表示呢?我们接下来介绍。

    专题推荐

    推荐视频教程
  • MySql参考手册MySql参考手册
  • PHP+Jquery+Mysql实现省市县三级联动PHP+Jquery+Mysql实现省市县三级联动
  • MySQL权威开发指南(教程)MySQL权威开发指南(教程)
  • MySQL数据库技术小知识每日分享MySQL数据库技术小知识每日分享
  • MySQL高级进阶视频教程MySQL高级进阶视频教程
  • 视频教程分类