为什么字符串称为字符串?
核心要点
- 编程术语“字符串”(string)的起源被认为与印刷术时代相关,当时印刷商根据印刷材料的长度(以英尺为单位)收费。他们将印刷好的材料串在一起,用“string”(字符串)这个词来表示字符序列。
- 在20世纪40年代和50年代发表的论文中,发现了最早使用“string”来表示与现代编程类似含义的学术参考文献。这些早期用法指的是相同符号的序列或标点符号或空格之间连续的字母串。
- 我们今天在编程中所知的“string”(字符串)这个术语似乎在20世纪60年代得到了确立,出现在各种学术论文和资源中。它用于表示一组具有含义并带来某些成本的字符,类似于它在印刷术时代的用法。
- 尽管“string”(字符串)这个术语在现实世界中没有等效词(我们不会将书页上的文字称为“strings”),但它已成为计算机科学中一个普遍理解的术语,代表着一种流行的数据类型。作者认为,可能没有其他术语比这个术语更适合这种数据类型。
这是SitePoint PHP通讯7月25日版的社论。
为什么字符串被称为字符串?你有没有想过这个问题?除了编程之外,我们从未在其他语境中使用过这样一个词来表示粘在一起的一组字母,然而——在编程中,它就像“变量”这个词一样普遍。这是为什么,它从哪里来?
为了弄清楚,我们必须先解决一些相关的术语。历史课时间!
单词font(字体)源自法语fonte——熔化过的事物;铸件。鉴于印刷机的字母确实是金属制成的,并在铅字铸造厂熔化,这很有道理。
术语uppercase(大写)和lowercase(小写)指的是字体运输所用字盒的字面部分。因此,印刷工(人)有一个沉重的字盒,他随身携带或在印刷机上设置,在这个字盒中有两个“级别”——一个大写字母盒,一个小写字母盒。大写字母盒只包含——你猜对了——大写字母,而小写字母盒只包含小写字母。
你会注意到,小写字母比大写字母多。这是可以预料的——一个字母在一页上只能使用一次,毕竟,书面文本中的小写字母比大写字母多得多,因为那时还没有Youtube评论和大小写锁定。
那么这一切与字符串有什么关系呢?
好吧,随着印刷变得越来越主流,印刷机开始向个人提供服务,而不仅仅是报纸和出版商,据说他们决定根据印刷材料的长度(以英尺为单位)收费。当然,很多都是推测性的,但如果他们将生产的印刷材料串在一起,他们就可以很容易地估计成本并向客户收费。因此,我们可以相当肯定地得出结论,他们在这种情况下使用string(字符串)这个词来表示字符序列。
2017年7月26日编辑:正如下面的评论中所指出的,似乎确实有一根实际的绳子用于将字符块捆绑在一起,因为它们在组装后被运送到印刷机!一位Twitter粉丝甚至给我发了以下视频,演示了这个过程!
尽管如此,这与编程领域有什么关系呢?我的意思是,你可以说关于任何东西的任何东西的字符串,它在非编程世界中都会有一定的意义。它只是一个可以很容易地普遍应用于事物的词,即使它通常不被使用。
如果我们看看学术界对第一份参考文献的记载呢?
在1944年的《递归可枚举的正整数集及其判定问题》中,我们提到了一种可能大致类似于现代定义的内容:
为了工作的目的,我们引入字母6,并考虑“字符串”1和b,例如11b1bb1。
在这篇论文中,这个术语指的是相同符号的序列,所以是一串1或一串b。这并不完全符合我们的定义,但这只是一个开始。
然后,整整14年后,在1958年的《一种用于机械翻译的编程语言》中,这个词是这样使用的,而且只使用了一次:
标点符号或空格之间的每个连续字母串都在字典中查找。
好吧,有点类似于我们对字符串的概念,但看起来他只是在描述,嗯,单词。显然,这并不适用——它太笼统了。然而,由于某种原因,它似乎已经流行起来。
在1958年的《一种用于处理符号串的命令语言》中,string(字符串)这个词的使用方式与我们今天完全相同,尽管没有定义为这样。
我们在1959年的《用于机械翻译的COMIT系统》中找到了另一个参考文献:
如果我们想用COS(F) D (F)替换D SIN(F),其中F不受限制,可以是任何任意的组成部分序列,我们使用符号$来表示这个字符串。
有趣!这是我们都从PHP中知道的美元符号,它实际上是BASIC中的字符串符号。
同样在1959年,我们在《Share 709系统:符号编程的机器实现》中得到了一个更直接的定义:
文本是线性排序的位串,表示加载和列表过程中所需的其他信息。
事实上,正是通过1960年4月的ALGOL,字符串似乎采用了其现代的简写形式“string”(在此之前,人们说string of [something])。请参阅这篇论文的摘要。
然后,在1960年5月,《关于算法语言ALGOL 60的报告》以一种触及核心内容的形式提到了它。
从那时起,它就像现代的模因一样迅速传播开来。
1963年的《METEOR:一种用于字符串转换的LISP解释器》使用了相当不具体的“[...]但某些线性列表(字符串)的简单转换在这个符号中很难定义。”
1964年的《关于声明任意编码字母表》提到“字符字符串”。
搜索ACM显示了60年代及以后的许多其他资源,所有这些资源现在都定期使用这个术语,因此,60年代似乎是这个术语演变的催化剂,并使其成为今天的样子,缓慢地,通过它所处的系统的需求。很有趣的是,它最终代表的概念与印刷术时代的概念相似——一组具有含义并带来某些成本的字符(只是这次是在内存中)。
作为旁注——考虑一下60多年前的所有这些论文。60年前,他们用穿孔卡片解决计算机科学问题,并在学术论文中写到这些问题。而我们现在是2017年,有2017年的JavaScript框架,争论着谁可以在Drupal的社区中与谁发生性关系,并试图一遍又一遍地重新定义Facade这个词。当我们争论“东西进入盒子,东西从盒子出来”的现代网络开发的火箭科学时,那些人通过将他们所处的模拟环境转化为数字环境来塑造整个世界,通过本质上欺骗一小撮沙子来记住数字。
结论
所以现在我们知道了——或者至少认为我们知道——string(字符串)从哪里来。计算机科学一直是一个充满神秘和缓慢演变的黑暗空间,就像我们现在知道人眼在其过去有半阶段和半眼一样,计算机科学中的术语也已经超越并围绕其原始含义演变,直到它们给了我们今天所拥有的东西。20世纪60年代在各个地方同时诞生了相同名称的相同概念,直到它演变成一个我们都理解和使用的统一术语,最重要的是,我们都能达成一致。
当你仔细想想,我们还能用一个更好的词吗?虽然由于与“现实世界”中类似术语的完全脱节,string(字符串)几乎感觉不自然(我们不会将书页上的文字称为“strings”),但我无法想到任何更适合这种流行数据类型的术语。你能吗?告诉我。
计算机编程中字符串的常见问题解答(FAQ)
计算机科学中“字符串”一词的历史起源是什么?
计算机科学中“字符串”一词被认为起源于“字符字符串”短语。它最早是在编程早期使用的,当时数据通常表示为字母数字字符的序列或“字符串”。这个术语被用来描述编程语言中作为字符序列的数据类型,并且它一直沿用至今。
字符串与编程中的其他数据类型有何不同?
字符串是字符序列,可以包括字母、数字和特殊字符。与整数或布尔值等其他数据类型(分别表示数值或真/假值)不同,字符串用于表示和操作文本。它们几乎是所有编程语言中的基本数据类型,并且它们带有多种内置方法用于操作和分析。
为什么某些编程语言中的字符串是不可变的?
在Java和Python等一些编程语言中,字符串是不可变的。这意味着一旦创建了一个字符串,就不能更改它。这种设计选择主要是出于效率和安全原因。由于字符串经常在程序中大量使用,因此使它们不可变可以使系统优化内存使用和处理速度。它还可以防止与可变字符串相关的潜在安全风险。
字符串是如何存储在内存中的?
字符串通常存储在内存中,作为字符序列,每个字符占用一定数量的字节,具体取决于所使用的字符编码。例如,在ASCII编码中,每个字符占用一个字节的内存,而在Unicode编码中,字符可以占用两个或多个字节。字符串的结尾通常用特殊的空字符标记。
可以对字符串执行哪些常见的操作?
可以对字符串执行许多操作,包括连接(将两个字符串连接在一起)、子字符串提取(获取字符串的一部分)、字符串比较(检查两个字符串是否相等)和字符串搜索(在字符串中查找特定字符或子字符串)。这些操作通常作为编程语言中的内置方法提供。
如何将字符串转换为其他数据类型?
大多数编程语言都提供函数或方法来将字符串转换为其他数据类型。例如,在Python中,可以使用int()函数将数字字符串转换为整数,或使用float()函数将其转换为浮点数。但是,如果字符串不表示有效的数字,则这些转换将失败。
什么是字符串插值?
字符串插值是一种编程技术,其中变量或表达式直接插入到字符串中。这通常用于以更易读和方便的方式格式化字符串。字符串插值的语法因编程语言而异。
字符串和字符数组有什么区别?
字符串是字符序列,而字符数组是一个数组,其中每个元素都是一个字符。在C等一些编程语言中,字符串表示为以空字符结尾的字符数组。但是,在许多高级语言中,字符串是一种具有自身方法和属性的单独数据类型。
什么是字符串文字?
字符串文字是直接写入程序源代码的字符串。它通常用引号括起来,具体是单引号还是双引号取决于编程语言。字符串文字被视为常数值,在某些语言中,它们是不可变的。
字符串中如何表示特殊字符?
字符串中的特殊字符,如换行符、制表符或引号字符,通常使用转义序列表示。转义序列是一个反斜杠 () 后跟一个字符或字符序列。确切的语法和可用的转义序列因编程语言而异。
以上是为什么字符串称为字符串?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

JWT是一种基于JSON的开放标准,用于在各方之间安全地传输信息,主要用于身份验证和信息交换。1.JWT由Header、Payload和Signature三部分组成。2.JWT的工作原理包括生成JWT、验证JWT和解析Payload三个步骤。3.在PHP中使用JWT进行身份验证时,可以生成和验证JWT,并在高级用法中包含用户角色和权限信息。4.常见错误包括签名验证失败、令牌过期和Payload过大,调试技巧包括使用调试工具和日志记录。5.性能优化和最佳实践包括使用合适的签名算法、合理设置有效期、

会话劫持可以通过以下步骤实现:1.获取会话ID,2.使用会话ID,3.保持会话活跃。在PHP中防范会话劫持的方法包括:1.使用session_regenerate_id()函数重新生成会话ID,2.通过数据库存储会话数据,3.确保所有会话数据通过HTTPS传输。

SOLID原则在PHP开发中的应用包括:1.单一职责原则(SRP):每个类只负责一个功能。2.开闭原则(OCP):通过扩展而非修改实现变化。3.里氏替换原则(LSP):子类可替换基类而不影响程序正确性。4.接口隔离原则(ISP):使用细粒度接口避免依赖不使用的方法。5.依赖倒置原则(DIP):高低层次模块都依赖于抽象,通过依赖注入实现。

在PHPStorm中如何进行CLI模式的调试?在使用PHPStorm进行开发时,有时我们需要在命令行界面(CLI)模式下调试PHP�...

PHP8.1中的枚举功能通过定义命名常量增强了代码的清晰度和类型安全性。1)枚举可以是整数、字符串或对象,提高了代码可读性和类型安全性。2)枚举基于类,支持面向对象特性,如遍历和反射。3)枚举可用于比较和赋值,确保类型安全。4)枚举支持添加方法,实现复杂逻辑。5)严格类型检查和错误处理可避免常见错误。6)枚举减少魔法值,提升可维护性,但需注意性能优化。

如何在系统重启后自动设置unixsocket的权限每次系统重启后,我们都需要执行以下命令来修改unixsocket的权限:sudo...

静态绑定(static::)在PHP中实现晚期静态绑定(LSB),允许在静态上下文中引用调用类而非定义类。1)解析过程在运行时进行,2)在继承关系中向上查找调用类,3)可能带来性能开销。
