原标题:那个用文言文编程的小哥,竟从28万行唐诗中找出了对称矩阵
梦晨 萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI
你能看出来,这首诗妙在哪里吗?


创造这个奇妙组合的,不是文学研究大师,而是一位程序员小哥。
他用计算机,找出了所有符合规律的古诗,还在Github上开源了代码。
就连README文件,也颇具个性:
余所用之程序,當以gcc編譯之如是
gcc -O3 mgsq5.c -o mgsq5
等一下。这个风格好像很熟悉?
没错,这位程序员,正是之前开发了火遍全网的文言文编程语言的Huang Lingdong。
他用数学中的3阶幻方(九宫格)作比,把符合这种规律的诗命名为“唐诗幻方”。
然而,这首诗真正的玄妙之处,还不止在这里。
玄妙之处
这首诗,初看只是横竖都能读,但如果把其中汉字编码成数字再看的话,会发现:
原来,这是个对称矩阵!

他只能退而求其次,只寻找奇数项对称的,即每句第1、3、5、7个字对称,偶数行用空行代替。
放宽标准后倒是能找出不少,但再想从其中挑选符合音韵格律、意思上还通顺的,就不多了。
最后,他选择了其中一个还稍微过得去的做例子,把空行中的字也加上,也能写成对称矩阵:



就这样,得出了要寻找的目标:第n行和第n列的文字相同。
璇玑图中共841个字,按顺读、逆读、横读、斜读、蛇行读、交叉读、换行读、换列读、间句读都能成诗,总共包含了7958首诗。
而且是用现代人的方法——编程来解决。
以“暴力”治之
这位小哥,先是想到了用“八皇后问题”的计算机解法,来找出符合要求的唐诗。
八皇后问题,简单来说是这样的:
8×8的国际象棋棋盘上,摆放8个不同的皇后,使其不能互相攻击,即处在同一行、同一列、同一斜线上,求解摆放方法。


例如,计算机先从13万行唐诗中,随机找出诗句“风月清江夜”:





在这几步操作中,要是有任何一步无法满足条件,就得全部推倒重来。
这样的话,最初的第一步,就显得尤为重要:从什么类型的诗句开始遍历,才能最快地找到答案?
他为此用上了启发式搜索,从已知问题信息入手,对这些空格进行评估,找到限制条件最多、即最容易“下笔”的那个位置,再从这个位置开始找诗。
具体写成代码求解的话,就是利用递归法的结构。
同时,用上剪枝法,缩小剩下位置的查找范围。
也就是说,要用到约束函数,在扩展节点处剪去不满足约束条件的子树;再用限界函数,剪去得不到最优解的子树。
然而在运行代码时,作者却发现,这样做效率并不高。
这种方法,虽然可以求解“N”皇后问题,却不太适合求汉字矩阵。
因为,要填进格子里的,可不止8个皇后,每一格可以填的汉字,就有5000+种选择!
如果没有找到最初那个合适的字,往往搜到一半后,能用的诗句就没了,又得重新再猜,效率不升反降。
越想越烦躁,这位小哥干脆一拍大腿:不如暴力搜索!
会有两个搜索条件:
其一,以五言诗为例,第五列的前4个字,和第五行的前4个字,内容是否完全一样?如果不一样,就扔掉。
△ 第五行和第五列的前4个字
其二,这首诗是不是对称矩阵?不是的话,就扔掉。
作者表示,自己并非文学研究的专家,也不是算法专家,因此,这种方法可能并不是最好的办法。
诸君若有更好的求解思路,可以来找他玩耍~
作者介绍
这位小哥热爱编程和传统文化,还开发过写诗IDE,能自动检查平仄等格律规则,内置韵书和康熙字典做参考。
还能通过机器学习分析用户作品,并与《全唐诗》中的诗句做比对,看你写的诗像哪位诗人的风格。


项目地址:
https://github.com/LingDong-/magic-square-poems
Huang Lingdong主页:
https://lingdong.works/