Files
spider-ctext/分类.md
2026-03-22 16:43:10 +08:00

7.7 KiB
Raw Blame History

类书分类与特点梳理

为辅助专业诗歌创作小程序提供“知识库”,整理现有类书数据的优缺点、特点及在辅助创作中的核心价值如下:

一、词条式

这类类书通常以主题(如天文地理、自然物候等)分类,适合根据意象(如“雪”、“月”)进行正向检索找语料。

  • 《白孔六帖》

    • 内容与编排顺序:按天文地理、历法礼仪、生活物件等类目编排。
    • 特点:采辑各种典籍中的成语、典故、短语,多为四字短句,并附带简短的释义。
    • 整理问题:提取很不干净,正文与释义括号混合在一起且缺乏断句。
    • 辅助创作价值可作为提炼“四字骈语”或冷僻典故的原始素材库但需大量NLP清洗。
    • 典型例子"content": "白髙眀柔克(髙明天也柔克寒暑不干)隂隲下民(言天黙定下民之命)天尊(地卑)..."
  • 《北堂书钞》

    • 内容与编排顺序:按帝王、后妃、政术、刑法、官职、礼仪等社会制度与名物编排。
    • 特点:成书于隋,引用起自三代、汉、魏,迄于宋、齐。侧重于对概念的追本溯源,对词条解释较为详细。
    • 整理问题JSON提取的正文部分缺乏标点长句粘连。
    • 辅助创作价值:古朴凝练。如创作者需要引用较为正统的经史概念(如写咏史诗),该书能提供最原汁原味的早期语料。
    • 典型例子"content": "皇者天人之總稱 帝者天號 正氣爲帝 帝者天下之所適王者天下之所徃也..."
  • 《初学记》

    • 内容与编排顺序:按天、岁时、官职、地理等编排。每个词条下细分为“叙事”、“事对”、“诗文”。
    • 特点:词条内容非常详细、层次分明,具有极强的结构化特征。
    • 整理问题整理得非常干净JSON层级保留了原始分类结构。
    • 辅助创作价值价值极高。“事对”直接提供了现成的对仗词汇(写诗利器);“诗文”栏目则方便查阅前人咏此物的范本。
    • 典型例子"事对": "轉葢 倚杵(桓譚新論天如葢轉左旋... 覆盆 轉轂(王充論衡曰..."
  • 《海录碎事》

    • 内容与编排顺序:按非常细碎的关键词(天、地、衣冠等)分类。
    • 特点:每一类下词条过细(常为生僻两字词),每一词条下内容极少,通常只有一两句包含该词的引文。
    • 整理问题:词条过度碎片化,键名就是细碎词汇。
    • 辅助创作价值:相当于一个“逆向用词示例库”。诗人想用某个生僻意象时,用它查看古人如何将其嵌入诗句中。
    • 典型例子"曽穹": [{"content": "蹀足循廣除瞬目矖曽穹(文選謝惠連詩)"}]
  • 《骈字类编》

    • 内容与编排顺序:按天地、时令、山水、珍宝、器物等词汇大类编排。
    • 特点:专收“骈语”(双音节词),词条极多,详细列出了该词在各路经史子集中出现的位置。
    • 整理问题:长段引文粘连,缺少现代标点。
    • 辅助创作价值价值极高。古诗词创作最核心的就是对“双字词汇”的拿捏,此书就是一个庞大且天然的古典双字词语境库。
    • 典型例子"天地": "易干夫大人者与天地合其德 又坤天地变化草木蕃天地闭贤人隐..."
  • 《太平御览》

    • 内容与编排顺序:以天、地、人、事、物为大类顺序。
    • 特点:在前代《修文殿御览》《艺文类聚》等书基础上编纂而成,包罗万象,词条内容全部为原文引文。
    • 整理问题:带有原书排版格式(换行、《书名》曰),阅读体验较佳。
    • 辅助创作价值:提供最详实的事物背景知识,适合在需要了解某个意象(如“雪”)的全面历史文化背景时使用。
    • 典型例子"《三五曆記》曰:未有天地之時,混沌狀如雞子,溟涬始牙..."
  • 《艺文类聚》

    • 内容与编排顺序:按天、岁时、地理、帝王、人、乐、职官等编排。
    • 特点:事文交织。词条收录较广,既有经史中的“叙事”,也有大量的历代【诗】、【赋】、【赞】。
    • 整理问题:带有原书的标点和分段标记,格式清晰。
    • 辅助创作价值:极好的文学创作资料库,帮助创作者一站式看到某个主题在古代诗文中的各种形态。
    • 典型例子"【詩】晉傅玄《兩儀詩》曰:兩儀始分.元氣上清.列宿垂象.六位時成..."
  • 《玉海》

    • 内容与编排顺序:详分天文、地理、典章制度等。
    • 特点:词条常为长篇大论,注重典章制度、天文地理的详细考证。
    • 整理问题:存在词条名拆分或提取不精准的问题(如把“中宫二十八舍”拆断处理)。正文缺乏标点。
    • 辅助创作价值:提供精准宏大的制度与天文星象知识,适合创作偏严肃或庙堂题材的诗歌。
    • 典型例子"中宫": "漢天文志(史天官書同)中宫天極星其一明者泰一之常居也旁三星三公..."
  • 《渊鉴类函》

    • 内容与编排顺序:按大部类排布。
    • 特点:清代集大成之作,将引文明确区分为“原”(原类书已有)与“增”(清代新增)。
    • 整理问题:使用空格作为句读分隔,未见全角标点。
    • 辅助创作价值:覆盖面最广的兜底宝库,适合查阅各种意象的演变和最全面的引文集合。
    • 典型例子"原釋名曰天坦也坦然髙而逺也 增又曰天顯也在上髙顯也..."

二、韵式

这类类书专为押韵而生,以“韵母”或“韵字”为一级分类,适合在写格律诗卡壳、需要找特定韵脚词汇时使用。

  • 《佩文韵府》

    • 内容与编排顺序:按平水韵分类(如“一东”),下系以该字为尾的各种词条及摘句。
    • 特点:非常详细,包含声调、韵部说明,以及海量的带出处短句。以元代《韵府群玉》和明代《五车韵瑞》为基础增补。
    • 整理问题JSON结构层次非常清晰。使用“丨”符号代替原韵字如“東”被替换为“丨”
    • 辅助创作价值写诗必备神器。想用“东”韵时,能瞬间获得大量以东结尾的词汇(如“南东”、“活东”)及例句,极大辅助押韵。
    • 典型例子"(韵母)东": { "小韵描述": "东德红切眷方也...", "词条": { "活東": "爾雅科斗丨丨蝦蟇也...", "牆東": "後漢書避世丨丨王君公..." } }
  • 《韵府群玉》

    • 内容与编排顺序:按大韵分类,列出小韵和具体词条。
    • 特点:早期的韵书,条目较为简练紧凑。
    • 整理问题:条目内容被尖括号〈〉包裹,夹杂部分注音(如“徳紅切”)。
    • 辅助创作价值:与佩文韵府同理,但体量更小,适合快速查阅核心的传统押韵典故。
    • 典型例子"東": { "道東": "〈漢鄭𤣥事馬融辭歸融曰吾道東矣本〉" }
  • 《五车韵瑞》

    • 内容与编排顺序/
    • 特点/
    • 整理问题严重问题,当前文件夹内的 allorigins.json 数据获取失败,内容实际上是 Nginx 的 500 Internal Server Error 报错网页代码并非JSON数据。
    • 辅助创作价值:暂时无价值。需要修复爬虫和数据源。
    • 典型例子<html><head><title>500 Internal Server Error</title></head><body>...