php - urlencode后的每个%XX代表一个字节？-PHP中文网问答

微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

php - urlencode后的每个%XX代表一个字节？

大家讲道理 2017-04-11 09:41:04

[PHP讨论组]

0

2

1159

举报

中文urlencode后，每个%XX代表一个字节，是这样的吧？
所以urlencode('中')的结果是%XX%XX%XX（utf-8编码）

大家讲道理

光阴似箭催人老，日月如移越少年。

全部回复(2)

黄舟2017-04-11 09:43:04 2楼

对的，为了解决unicode的过于占用内存空间和扩展不变的问题，utf-8规范出现了。

对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。因此对于英语字母，UTF-8编码和ASCII码是相同的。
对于n字节的符号（n>1），第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。

也就是说utf-8的编码结果是变长的。
中字的utf-8编码为E4B8AD，所以对应的urlencode为%E4%B8%AD.

赞 +0

添加回复

PHPz2017-04-11 09:43:04 1楼

是的，URL编码纯粹是把特殊符号和非ASCII字符的的数据用十六进制表示出来，然后每个字节（也就是两位十六进制数）前加一个百分号。对于那些不特殊的ASCII字符的URL编码就是它本身。

同样一个中字，如果是GBK编码就是两个字节，如果是UTF-8就是三个字节。

当然，比较麻烦的是URL编码比较混乱。比如有的地方用+来表示空格，有的又是用%20，具体情况还是要具体分析。前者对应的是函数是urlencode，后者对应的是rawurlencode。通常前者用在表单数据中（包括URL中的query也就是?后的部分），后者用在URL路径中（host后query前的部分）

赞 +0

添加回复

专题推荐

更多>

热门话题

热门教程

更多>

相关教程

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部