Skip to content

Latest commit

 

History

History
364 lines (236 loc) · 8.48 KB

406-89935-[趣味拓展]各种符号_汉语拼音符号_中文全角英文字母_中文全角标点.sy.md

File metadata and controls

364 lines (236 loc) · 8.48 KB
show version enable_checker
step
1.0
true

各种符号

回忆上次内容

  • 中文字符可以有各种分类方法
    • 声母
      • 拼音检字法
    • 韵母
      • 合辙押韵的分类
    • 偏旁部首
      • 实际上unicode的排序方法

图片描述

  • 我们以前勇闯地下城时候获得了一把屠龙宝刀
    • 给他镶上了❤️宝石
    • 这 桃心字符❤
    • 应该如何理解?

闭环

  • 首先是文字
    • 我们的汉字
    • 可以构成一个闭环

图片描述

  • 这♥
    • 也可以构成
    • 一个闭环吗?

构成闭环

  • 这种编解码方式是unicode-escape

图片描述

  • 也可以构成闭环

图片描述

  • 这符号
    • 最初怎么来的呢?

插入符号

  • 搜索出来的
    • ♠ ♣ ♥ ♦
    • 把字符复制下来

图片描述

  • 然后粘到系统里面观察
  • 类似的有很多好玩的东西
    • ꧁༺新闻༒计算༻꧂
    • ༺动院༒编程༻
  • 加到名字里感觉萌萌哒
    • ლ(′◉❥◉`ლ)

输出符号

  • 这些其实都是
    • uncode字符

图片描述

  • 这些字符是
    • 可以作为字符串里的字符
    • 输出的
  • 但是他的 ordinal (序号) 是多少呢?

得到序号

  • 通过字符得到序号 ord
  • 反过来通过序号得到字符 chr

图片描述

  • 输出红心试试

图片描述

  • 真的可以
  • 这个红桃符号在存储和传输的时候传的都是二进制形式
  • 可以看看红桃的序号的 16进制 或者 2进制 形式么 ?

16 进制

  • 字符可以拼合
    • 前面一个 \u
    • 后面加上 4位 16进制 数
    • 就可以进行输出字符

图片描述

  • 好像是又在\转义(escape)了
  • 这次的转义序列是\u2660
  • 黑红梅方都可以有对应序号么?
    • 不要翻篇
    • 上下找找
    • 自己试试

遍历花色

  • 从0x2660到0x2670
    • 将这16个数字对应的字符进行输出

图片描述

  • 他们分别都是多少呢?

遍历扑克

图片描述

  • 选出实心的黑红梅方

转义

图片描述

  • 我想要的不是默认红
  • 我想要纯红色的大红心
  • 怎么办?

回忆颜色

  • 高亮基础色

图片描述

  • 然后我们了解了\33[38;5;XXXm 索引颜色
    • 每个颜色 0-5 总共 6 级

图片描述

  • 甚至可以用RGB得到各种颜色

    • \33[38;2;R;G;Bmoeasy\33[0m
    • 颜色真不少了
  • 我想用大红色画个桃心 ♥️

  • 有可能吗??🤔

大红心

图片描述

  • \33[38;5;196
    • 使用索引色
  • 196 = 16 + 62*5 + 61*0 + 60*0
    • 红色打满

图片描述

  • rgb形式 也没有问题
  • 那么 红色方板 应该怎么做呢?

图片描述

  • 这个\u 又是什么意思呢?
  • 好像是也是一种通过数字找到对应字符的方法
  • 以前都有什么通过数字找字符的方法呢?

ascii

  • 最基础的肯定是ascii
sudo apt install ascii
ascii

图片描述

输出字符

  • 可以用\输出字符
    • \xhh
      • x意味着hexdecimal
      • h 是十六进制数子
    • \ooo
      • o 是八进制数字

图片描述

  • 不要翻页
  • 再复习 如何用chr函数
    • 通过 数字直接输出oeasy字符串

输出

图片描述

  • 尝试用16进制和8进制输出

数字化输出

图片描述

  • 可是这个\u 究竟是什么呢?

图片描述

  • 不会了就去搜帮助

查看帮助

图片描述

  • 查找关于字符串的帮助
  • 具体转义序列语法如下

图片描述

  • \nnn 8 进制
  • \xhh 16 进制
  • \uhhhh 4 位的 Unicode 编码
  • \Uhhhhhhhh 8 位的 Unicode 编码
  • 那我们胡乱来试试吧

具体试试

  • \u后面
    • 4 位 16 进制数
    • 对应一个字符

图片描述

  • 这种对应关系就像ascii
    • ascii
      • 7 位 2进制数 对应一个字符
    • unicode
      • 范围更广
      • 字符更多
  • 其中中文标点
    • 我们要特别注意

调出中文标点

  • 点击桌面的sogou输入法
    • 开启中文输入法模式

图片描述

  • 可以切换
    • 中英文输入法
    • 全角半角

编程注意

  • 编程的时候
    • 只能使用英文标点
      • 不能使用中文标点
  • 这是为什么呢?

图片描述

  • 注意下图的括号不是半角的

原理

  • 中文括号和英文括号对应的根本不是一个序号
    • python解释器解释不下去
      • 就会报错了

图片描述

  • 引号,逗号等符号都要使用英文半角的
  • 在哪里切换标点的全角半角呢?

切换全角半角标点

  • 下图红框位置就是切换全角半角标点的位置

图片描述

  • 可以切换中英文标点
  • 那旁边的月亮怎么理解呢?

全角半角英文字符

  • 圆月是全角英文
  • 半月是半角英文

图片描述

  • 为什么会有全角英文字符呢?

全角英文

图片描述

  • 序号位置在中文之后

图片描述

  • 最初目的是和中文字符等宽
    • 其实也可以生成一系列特殊词元token
    • 因为这些词元看起来是英文单词
    • 但实际上并不是
  • 这应该是一块有趣的区域!
  • 另外汉语拼音字符
    • 应该如何理解呢?

汉语拼音

  • 汉语拼音符号:ā á ǎ à ō ó ǒ ò ē é ě è ī í ǐ ì ū ú ǔ ù ǖ ǘ ǚ ǜ ü ê ɑ  ń ň ǹ ɡ

图片描述

  • 这些序号
    • 好像并不是连续的
    • 可以将他们一起解码吗?

观察unicode编码

  • unicode中并没有汉语拼音block

图片描述

  • 我们把各个地方散乱的字符
    • 当做汉语拼音来用...

图片描述

  • ǖ ǘ ǚ ǜ ü 也是来自于拉丁语扩展

更多拼音

图片描述

  • 也有相应的拼音字符

1.[á]/[â] 2.[ǎ] 3.[ā] 4.[a̖]/[ȁ] 5.[a̗] 6.[à]

总结

  • 这次再次输出了大红心
    • 找到了红心对应的编码
    • 黑红梅方都对应有编码
  • 原来的编码叫做 ascii️
    • \u这种新的编码方式叫unicode
    • 包括了 中日韩字符集等 各书写系统的字符集
  • 除了这些常规字符之外
    • 还有什么好玩的东西呢?
  • 下次再说!👋