python - 使用django搭建双语版网站,希望能给点建议
阿神
阿神 2017-04-17 16:59:33
[Python讨论组]
阿神
阿神

闭关修行中......

全部回复(2)
大家讲道理

由于简体和繁体并不是单纯转换文字就能用的(繁体和简体的用词,语义很多都不同,只能人工做i18n)
比如
chs - cht
硬盘 - 硬碟
内存 - 記憶體
这些并不能直接通过转换繁简体来完成,需要有一个繁简分歧词表
分歧词表参考 : 维基百科 - 繁简分歧词表


方案:
1.建立双库。
2-1. 针对已有内容:读取简体库内容,通过下方py开源库转换为繁体,存入繁体库。
2-2. 针对后期内容:在存入简体库的时候加一个繁体转换,存入繁体库。


一个汉语言处理开源库,提供了汉语分词和繁体简体转换(包括上述的分歧词)希望有所帮助

https://github.com/Tony-Wang/YaYaNLP (python,修改自下方java库)

https://github.com/hankcs/HanLP (java)


@vimac
word的转换一来效率低,二来分歧词(也就是你说的用词差异)处理率很低。不能实现自动化操作。

怪我咯

一个土办法,不知道是否可行

  1. 导出你的简体中文内容的SQL(或者CSV等等,只要是文本形式的)

  2. 用Word的简繁转换转换为繁体,Word的简繁转换是考虑了用词差异的(例如鼠标 => 滑鼠)

  3. 导回去(当然记得改库名表名)

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号