可爱的中文分词信息图
一张可爱的手绘教育信息图,讲解中文中的分词,包含四个柔和的对比面板、Q版角色以及 token/字节示例。画面具有温暖的手帐笔记本美学,带有圆润形状、涂鸦和友好的手写字体。
模型: gpt-image-2分类: Infographic/Edu Visual风格: Illustration语言: en
提示词
一张可爱手绘剪贴簿风格的中文横版教育信息图,背景是温暖的米黄色纸张,带有圆角边框、柔和的涂鸦、胶带贴纸、小星星,以及课堂笔记本的美术风格。顶部居中有一个用俏皮手写中文写成的大标题:“什么是分词?”,其中后半部分为珊瑚粉色,其余为深棕色。左上角有一个Q版柴犬老师角色,正面站立,穿着浅黄色衬衫和蓝色领带,手里举着指示棒,旁边有一个对话气泡写着“今天来学习分词(Tokenization)! ”。右上角有一个可爱的蓝色方形 Token 吉祥物,标注“TOKEN”,带着笑容坐着,脸颊泛红,四肢很小,手里拿着放大镜;旁边有一个对话气泡写着“我是 Token!被切得越合理,模型越聪明!”。靠近右侧边缘,添加一个小小的悬挂便签卡片,写着“知识点 收藏夹”,并带有一个爱心图标。标题下方放置一个圆角虚线文本框,包含定义:“分词是将人类可读的文本切分成 Token 的过程。”其中“Token”一词用蓝色高亮。再往下,添加一行说明文字:“下面以 “程序员Left” 和 “人工智能” 为例,看看不同的分词方式:”其中“程序员Left”用浅蓝色高亮,“人工智能”用粉色高亮。下半部分恰好包含 4 个从左到右排列的圆角浅色面板,每个面板都有编号徽章和标题。面板 1 为薄荷绿色,标题为“1 词级分词”。包含副标题“按完整语义划分文本”,并且恰好有 3 个 token 气泡:“程序员”、“Left”、“人工智能”。在该面板底部,展示柴犬老师竖起大拇指,带有一个对话气泡写着“语义完整,容易理解!”。面板 2 为浅黄色,标题为“2 字符级分词”。包含副标题“逐字切分文本”,并且恰好有 9 个圆形 token 气泡按行排列:“程”、“序”、“员”、“L”、“e”、“f”、“t”、“人”、“工”、“智”、“能”——以示例文本中的单个字符形式呈现,并排成紧凑网格。在底部,展示蓝色 token 吉祥物拿着铅笔,旁边有一个对话气泡写着“粒度最细,但序列会很长~”。面板 3 为浅粉色,标题为“3 子词分词”。包含副标题“按词根以及前后缀划分”,并且恰好有 5 个 token 气泡:“程序”、“员”、“Left”、“人工”、“智能”。在底部,展示柴犬老师思考的样子,一只爪子放在嘴边,头顶上方有一个问号,旁边有一个对话气泡写着“折中方案,效果 often 很好!”。面板 4 为浅蓝色,标题为“4 字节级分词”。包含副标题“将字词转为字节编码,根据转换后的内容进行组合和划分”,并展示恰好 14 个小圆形代码气泡:“E7”、“A8”、“8B”、“...”、“66”、“74”、“E4”、“BA”、“BA”、“E8”、“83”、“BD”、“...”按多行排列,像编码后的字节一样。底部再次展示蓝色 token 吉祥物,面带微笑,旁边有一个对话气泡写着“适合处理任意文本!”,附近还有一个小小的灯泡涂鸦。最底部放置一个圆角横幅注释,写着:“不同分词方式各有优势,实际应用中会根据任务和数据选择合适的方案哦!”。整体使用柔和的浅绿色、黄色、粉色和蓝色作为四个面板的主色,深棕色手写字体,细微阴影、圆润造型,以及贯穿始终的可爱萌系表情。保持画面平衡、整洁、友好,如同一张精致的社交媒体科普海报。