解构藏文
数据故事 · 探索对藏文字的数据挖掘与叙事
文字是历史的沉淀、是人与人之间进行交流的工具,同时也是连接文化的最小单位。藏文作为藏族人民平时所使用的语言与书写工具,历史之悠久在国内仅次于汉文,是一种极富表现力的优美文字。藏文书法是藏族文化艺术的重要组成部分,2008年,藏文书法经国务院批准列入第二批国家级非物质文化遗产名录。但在平时生活中,我们很少有机会接触到这种古老而神秘的文字。这一次,我们想利用创新、富有体验感的方式来讲述一个由藏文字连接到藏文化的数据故事,将藏文带入到大众视野,利用数据可视化建立起藏汉文化交流的桥梁,促进藏族文化的保护、传承与创新。
为了充分展示藏文字的魅力,这项目中,我们从"文字本体"、"书写过程"和"经典解读"三个角度来进行叙述。
在文字本体部分,通过藏文历史介绍、字母的书写、单词的排列组合等有趣的语言特征出发,设计了几个可视化的数字工具进行互动式的呈现;
在书写过程的呈现上,我们继承了土族盘绣项目中的研究方法,通过设计对比实验来呈现藏文书法书写的特点。这一次,我们邀请了来自青海果洛的藏文书法传承人和专业研习汉字书法的学生一起参与到实验中,让他们分别书写《玛吉阿米》这首诗歌的藏文版与汉文版,并采集了他们各自书写时脑电波数据与肌电数据,通过对比分析,希望揭示两种不同文字系统之间的书写差异。同时,我们也将书写的藏汉诗歌进行词语拆解,通过“墨水比”和“字形”的参数化分析,来进行文字形态上的对比;
最后的经典解读部分,我们选择了中国西藏最具代表性的民歌诗人仓央嘉措的经典诗歌集《仓央嘉措情歌》,对其中64首诗歌进行文本内容的可视化分析和情感解读,从层一个角度来展示藏文描绘出的情感世界。
数据采集
脑电数据:我们使用Mindwave Mobile设备对藏文书法传承人以及汉字书法书写者的脑电数据进行采集。Mindwave Mobile利用放置在前额的一个传感器和放置在耳部的电极触点进行脑电波信号测量,采集8个维度的数据以及eSense指数值。eSense指数值是ThinkGear对原始脑电波信号进行放大并过滤了环境噪音及肌肉组织运动产生的干扰,然后通过对处理后的信号应用eSenseblem算法进行计算得到的,用于表示专注度和放松度。通过脑电数据可以分析实验者书写运动时的心理活动变化情况。
肌电数据:实验中使用MYO手环采集藏文书法传承人和汉字书法书写者右手臂的表面肌电信号,测出佩戴者手势变化时肌肉的变化。MYO由八块生物电传感器单元组成,内置三轴加速器、三轴陀螺仪,可以采集到emg、加速度、陀螺仪和方向四个维度的数据,以此来分析书写两种不同文字的手势、运动以及用力之间的差异。
其他数据:除了脑电和肌电数据外,项目中还进行了图像、视频等数据的采集。例如,将书写的过程拍摄下来作为视频数据,同时记录下两个受测者的书写状态,便于主观评测与观察。视频观察也是一种有趣的分析方式,藏文书法书写时使用竹笔,需要频繁蘸墨瓶,通过视频可以统计出传承人写完这首诗需要蘸墨瓶的次数。我们也通过其他很多方式来对补充项目数据,包括利用社交网络收集整理了带有藏文字的招牌匾额高清图像;整理《仓央嘉措情诗》藏文、汉语和英语三个版本的文件;对其中的64首诗歌以及270个句子通过自然语言处理工具,得到每句诗句的情感数值等。
可视分析&图表设计
脑电/肌电数据:我们在实验过程中选用了脑电波数据中的专注度和放松度,并将这两个数据通过直方图的形式来进行分析,利用极坐标将其可视化。我们发现汉字书写所用时间短,注意力更容易持续的集中;而藏文构词结构复杂,所用时间较长,专注与放松交替进行。在肌电数据的处理上,我们使用了方差来计算肌电的数据值,用于表达当时的肌肉活动强度,再用平滑算法处理成更便于观察的EMG数据变化趋势曲线。因为汉字书法使用软头毛笔,书写动态柔和,可以看出肌肉数据变化小,线条较为平缓。而藏文书法使用竹笔,需要更好的控制力,用力程度大,因此肌肉数据变化大,线条波动剧烈。
藏汉文字对比的可视分析:我们将"墨水比"的概念引入文字解构的对比中,在保证藏汉文字书写规范和书写范围是相同的情况下,利用图像分析工具得出对应词语的用墨量大小和字面块。用墨量的呈现形式是长方形面积的大小,在长度是一定的情况下,比较"墨水量"的高低,可以看出藏文词语书写时在单位面积内"墨水量"大多是高于汉字的。当然这与比较所用的德昂洒智体有关,但也从一个侧面体现出了藏文书法装饰性强的特点。另外,我们也通过数字图像工具,对藏汉文字的轮廓进行了几何图形化处理。可以看到,汉字图形是接近正方形的不规则多边形,藏文字则更为修长,视觉上更符合黄金审美比例。
文本的可视分析:我们针对《仓央嘉措情歌》中六十四首诗歌的词频与情绪做了统计与可视化呈现,参考了词云图、关系图与树状图的形态,设计了一种新的可视化形式。视图由三层结构组成,最外圈是六十四首情诗中的句子,触及句子可以查看整首诗歌。内部的词云记录着当前诗歌中出现频率最多、最为重要的关键词。在诗歌句子的情感分析上,我们将诗歌的情感值划分了零到一百的区间,数值越小,情绪越消极,颜色越浅,数值越大,情绪越积极,颜色则越深。情绪通过热力图的形式来体现诗歌中每个句子的情感偏向。图中会发现一个很有意思的现象,诗集中的诗歌语句之间情绪波动剧烈,积极和消极内容往往交织在一起,这也许是诗歌能带给读者情绪冲击的最佳数据解释。
获奖&媒体报道
入选2021年IEEE VIS Arts Program艺术展览(作品入围率29%)
入选2021年中国可视化与可视分析大会(China VISAP'21)艺术可视化展览
获得2021年"中国数据内容大赛"最佳数据内容 金奖
获得2021年"第七届两岸新锐设计竞赛·华灿奖"华东赛区 一等奖
获得2021年"第七届两岸新锐设计竞赛·华灿奖"全国赛 三等奖
获得2021年"第三届中国大学生创意节总决赛"创意新媒体艺术 二等奖
入选"第四届中国设计大展及公共艺术专题展"
项目论文:
研究团队
项目组成员:
宋安琪宋欣潼
陈玉昊
罗光郁
李谦升 *
支持单位:
上海美术学院公共艺术协同创新中心(PACC)特别感谢:
嘎让尼玛(藏文书法传习人)华多尔(藏文书法传习人)
登德尔甲(藏文书法传习人)
张磊然(汉字书法学习者)