拿出来给昏昏欲睡的我们提神醒脑用的。
然后所有人就真的睡不着了,加班加点地熬夜,就是希望自己能够在这个架构上占有一席之地。
很快众人便开始讨论到最近刚立了一共的图形边缘识别技术上来。
这个技术其实是最早的字根识别技术发展而来,最初的目的在于检索到生字的时候,程序有能力将之自动拆解成相应的字根,再根据其组合规律等要素,自动地生成组字规则,而这个规则,又决定了字库的码位和输入方法。
瀚文字库二三期研发,除了两位老师兄提供的非常完整的汉字手工字卡以外,这个字根自动识别和汉字拆组技术,也是功不可没。
而微软正是看到了这个可见预期,才决定将一期瀚文字库捆绑在操作系统上,苹果和UNIX见到后立即跟进,三大系统都接受了统一码瀚文字库,便为统一全世界的汉字代码,奠定了坚实基础。
瀚文字库研发成功后,这项技术并非就束之高阁了,进一步发展成了图形识别技术。
字根作为图形意义上的信息携带者,是让计算机辨识起来最简单,最基本的图形,识别起来相当容易。
而要引入边际匹配,模糊匹配,混沌匹配,可就不是那么简单了。
三种匹配当中,边际匹配相对比较容易,给图形边缘设定各要素如图形三维边界参数等,以及可以忍受的冗余值,再将这些参数转化为矢量参数,以简化旋转的数学表达式,最后用程序表达出来,就能够模拟出人类对瓷片进行寻找边界,旋转调整,尝试拼合的整个过程。
这个过程最直接的运用就是拼合古代残器如大型碎瓷窖藏,青铜器窖藏,还有非常重要的——存世甲骨文图形档案。
举一个例子就能够形象地说明这个程序的用处。
目前国家几个博物馆,对于现存于世的所有带有文字的骨片,都进行过拓印,绘制,拍摄的工作。
这些甲骨发现年代不已,出土地点不已,转移过程复杂,存档方式不同,因此就出现了大量重复记录,颠倒拓拍,支离破碎的现象存在。
甲骨卜辞是研究商代历史的第一手资料,异常宝贵,然而所有的甲骨当中,残缺太甚的占了大多数,这就致使许多其刻辞支离破碎,不能通读,是一件非常令人惋惜的事情。
由此还特意诞生了一门学问——甲骨缀合。
这门学问之所以重要,便是因为它能使碎片经过拼接,变为完整或较为完整的卜辞,成为可利用