7.7 KiB
7.7 KiB
类书分类与特点梳理
为辅助专业诗歌创作小程序提供“知识库”,整理现有类书数据的优缺点、特点及在辅助创作中的核心价值如下:
一、词条式
这类类书通常以主题(如天文地理、自然物候等)分类,适合根据意象(如“雪”、“月”)进行正向检索找语料。
-
《白孔六帖》
- 内容与编排顺序:按天文地理、历法礼仪、生活物件等类目编排。
- 特点:采辑各种典籍中的成语、典故、短语,多为四字短句,并附带简短的释义。
- 整理问题:提取很不干净,正文与释义括号混合在一起且缺乏断句。
- 辅助创作价值:可作为提炼“四字骈语”或冷僻典故的原始素材库,但需大量NLP清洗。
- 典型例子:
"content": "白髙眀柔克(髙明天也柔克寒暑不干)隂隲下民(言天黙定下民之命)天尊(地卑)..."
-
《北堂书钞》
- 内容与编排顺序:按帝王、后妃、政术、刑法、官职、礼仪等社会制度与名物编排。
- 特点:成书于隋,引用起自三代、汉、魏,迄于宋、齐。侧重于对概念的追本溯源,对词条解释较为详细。
- 整理问题:JSON提取的正文部分缺乏标点,长句粘连。
- 辅助创作价值:古朴凝练。如创作者需要引用较为正统的经史概念(如写咏史诗),该书能提供最原汁原味的早期语料。
- 典型例子:
"content": "皇者天人之總稱 帝者天號 正氣爲帝 帝者天下之所適王者天下之所徃也..."
-
《初学记》
- 内容与编排顺序:按天、岁时、官职、地理等编排。每个词条下细分为“叙事”、“事对”、“诗文”。
- 特点:词条内容非常详细、层次分明,具有极强的结构化特征。
- 整理问题:整理得非常干净,JSON层级保留了原始分类结构。
- 辅助创作价值:价值极高。“事对”直接提供了现成的对仗词汇(写诗利器);“诗文”栏目则方便查阅前人咏此物的范本。
- 典型例子:
"事对": "轉葢 倚杵(桓譚新論天如葢轉左旋...) 覆盆 轉轂(王充論衡曰...)"
-
《海录碎事》
- 内容与编排顺序:按非常细碎的关键词(天、地、衣冠等)分类。
- 特点:每一类下词条过细(常为生僻两字词),每一词条下内容极少,通常只有一两句包含该词的引文。
- 整理问题:词条过度碎片化,键名就是细碎词汇。
- 辅助创作价值:相当于一个“逆向用词示例库”。诗人想用某个生僻意象时,用它查看古人如何将其嵌入诗句中。
- 典型例子:
"曽穹": [{"content": "蹀足循廣除瞬目矖曽穹(文選謝惠連詩)"}]
-
《骈字类编》
- 内容与编排顺序:按天地、时令、山水、珍宝、器物等词汇大类编排。
- 特点:专收“骈语”(双音节词),词条极多,详细列出了该词在各路经史子集中出现的位置。
- 整理问题:长段引文粘连,缺少现代标点。
- 辅助创作价值:价值极高。古诗词创作最核心的就是对“双字词汇”的拿捏,此书就是一个庞大且天然的古典双字词语境库。
- 典型例子:
"天地": "易干夫大人者与天地合其德 又坤天地变化草木蕃天地闭贤人隐..."
-
《太平御览》
- 内容与编排顺序:以天、地、人、事、物为大类顺序。
- 特点:在前代《修文殿御览》《艺文类聚》等书基础上编纂而成,包罗万象,词条内容全部为原文引文。
- 整理问题:带有原书排版格式(换行、
《书名》曰),阅读体验较佳。 - 辅助创作价值:提供最详实的事物背景知识,适合在需要了解某个意象(如“雪”)的全面历史文化背景时使用。
- 典型例子:
"《三五曆記》曰:未有天地之時,混沌狀如雞子,溟涬始牙..."
-
《艺文类聚》
- 内容与编排顺序:按天、岁时、地理、帝王、人、乐、职官等编排。
- 特点:事文交织。词条收录较广,既有经史中的“叙事”,也有大量的历代【诗】、【赋】、【赞】。
- 整理问题:带有原书的标点和分段标记,格式清晰。
- 辅助创作价值:极好的文学创作资料库,帮助创作者一站式看到某个主题在古代诗文中的各种形态。
- 典型例子:
"【詩】晉傅玄《兩儀詩》曰:兩儀始分.元氣上清.列宿垂象.六位時成..."
-
《玉海》
- 内容与编排顺序:详分天文、地理、典章制度等。
- 特点:词条常为长篇大论,注重典章制度、天文地理的详细考证。
- 整理问题:存在词条名拆分或提取不精准的问题(如把“中宫二十八舍”拆断处理)。正文缺乏标点。
- 辅助创作价值:提供精准宏大的制度与天文星象知识,适合创作偏严肃或庙堂题材的诗歌。
- 典型例子:
"中宫": "漢天文志(史天官書同)中宫天極星其一明者泰一之常居也旁三星三公..."
-
《渊鉴类函》
- 内容与编排顺序:按大部类排布。
- 特点:清代集大成之作,将引文明确区分为“原”(原类书已有)与“增”(清代新增)。
- 整理问题:使用空格作为句读分隔,未见全角标点。
- 辅助创作价值:覆盖面最广的兜底宝库,适合查阅各种意象的演变和最全面的引文集合。
- 典型例子:
"原釋名曰天坦也坦然髙而逺也 增又曰天顯也在上髙顯也..."
二、韵式
这类类书专为押韵而生,以“韵母”或“韵字”为一级分类,适合在写格律诗卡壳、需要找特定韵脚词汇时使用。
-
《佩文韵府》
- 内容与编排顺序:按平水韵分类(如“一东”),下系以该字为尾的各种词条及摘句。
- 特点:非常详细,包含声调、韵部说明,以及海量的带出处短句。以元代《韵府群玉》和明代《五车韵瑞》为基础增补。
- 整理问题:JSON结构层次非常清晰。使用“丨”符号代替原韵字(如“東”被替换为“丨”)。
- 辅助创作价值:写诗必备神器。想用“东”韵时,能瞬间获得大量以东结尾的词汇(如“南东”、“活东”)及例句,极大辅助押韵。
- 典型例子:
"(韵母)东": { "小韵描述": "东德红切眷方也...", "词条": { "活東": "爾雅科斗丨丨蝦蟇也...", "牆東": "後漢書避世丨丨王君公..." } }
-
《韵府群玉》
- 内容与编排顺序:按大韵分类,列出小韵和具体词条。
- 特点:早期的韵书,条目较为简练紧凑。
- 整理问题:条目内容被尖括号
〈〉包裹,夹杂部分注音(如“徳紅切”)。 - 辅助创作价值:与佩文韵府同理,但体量更小,适合快速查阅核心的传统押韵典故。
- 典型例子:
"東": { "道東": "〈漢鄭𤣥事馬融辭歸融曰吾道東矣本〉" }
-
《五车韵瑞》
- 内容与编排顺序:/
- 特点:/
- 整理问题:严重问题,当前文件夹内的
allorigins.json数据获取失败,内容实际上是 Nginx 的500 Internal Server Error报错网页代码,并非JSON数据。 - 辅助创作价值:暂时无价值。需要修复爬虫和数据源。
- 典型例子:
<html><head><title>500 Internal Server Error</title></head><body>...