Files
spider-ctext/分类.md
2026-03-22 16:43:10 +08:00

93 lines
7.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 类书分类与特点梳理
为辅助专业诗歌创作小程序提供“知识库”,整理现有类书数据的优缺点、特点及在辅助创作中的核心价值如下:
## 一、词条式
这类类书通常以主题(如天文地理、自然物候等)分类,适合根据意象(如“雪”、“月”)进行正向检索找语料。
- **《白孔六帖》**
- **内容与编排顺序**:按天文地理、历法礼仪、生活物件等类目编排。
- **特点**:采辑各种典籍中的成语、典故、短语,多为四字短句,并附带简短的释义。
- **整理问题**:提取很不干净,正文与释义括号混合在一起且缺乏断句。
- **辅助创作价值**可作为提炼“四字骈语”或冷僻典故的原始素材库但需大量NLP清洗。
- **典型例子**`"content": "白髙眀柔克(髙明天也柔克寒暑不干)隂隲下民(言天黙定下民之命)天尊(地卑)..."`
- **《北堂书钞》**
- **内容与编排顺序**:按帝王、后妃、政术、刑法、官职、礼仪等社会制度与名物编排。
- **特点**:成书于隋,引用起自三代、汉、魏,迄于宋、齐。侧重于对概念的追本溯源,对词条解释较为详细。
- **整理问题**JSON提取的正文部分缺乏标点长句粘连。
- **辅助创作价值**:古朴凝练。如创作者需要引用较为正统的经史概念(如写咏史诗),该书能提供最原汁原味的早期语料。
- **典型例子**`"content": "皇者天人之總稱 帝者天號 正氣爲帝 帝者天下之所適王者天下之所徃也..."`
- **《初学记》**
- **内容与编排顺序**:按天、岁时、官职、地理等编排。每个词条下细分为“叙事”、“事对”、“诗文”。
- **特点**:词条内容非常详细、层次分明,具有极强的结构化特征。
- **整理问题**整理得非常干净JSON层级保留了原始分类结构。
- **辅助创作价值****价值极高**。“事对”直接提供了现成的对仗词汇(写诗利器);“诗文”栏目则方便查阅前人咏此物的范本。
- **典型例子**`"事对": "轉葢 倚杵(桓譚新論天如葢轉左旋... 覆盆 轉轂(王充論衡曰..."`
- **《海录碎事》**
- **内容与编排顺序**:按非常细碎的关键词(天、地、衣冠等)分类。
- **特点**:每一类下词条过细(常为生僻两字词),每一词条下内容极少,通常只有一两句包含该词的引文。
- **整理问题**:词条过度碎片化,键名就是细碎词汇。
- **辅助创作价值**:相当于一个“逆向用词示例库”。诗人想用某个生僻意象时,用它查看古人如何将其嵌入诗句中。
- **典型例子**`"曽穹": [{"content": "蹀足循廣除瞬目矖曽穹(文選謝惠連詩)"}]`
- **《骈字类编》**
- **内容与编排顺序**:按天地、时令、山水、珍宝、器物等词汇大类编排。
- **特点**:专收“骈语”(双音节词),词条极多,详细列出了该词在各路经史子集中出现的位置。
- **整理问题**:长段引文粘连,缺少现代标点。
- **辅助创作价值****价值极高**。古诗词创作最核心的就是对“双字词汇”的拿捏,此书就是一个庞大且天然的古典双字词语境库。
- **典型例子**`"天地": "易干夫大人者与天地合其德 又坤天地变化草木蕃天地闭贤人隐..."`
- **《太平御览》**
- **内容与编排顺序**:以天、地、人、事、物为大类顺序。
- **特点**:在前代《修文殿御览》《艺文类聚》等书基础上编纂而成,包罗万象,词条内容全部为原文引文。
- **整理问题**:带有原书排版格式(换行、`《书名》曰`),阅读体验较佳。
- **辅助创作价值**:提供最详实的事物背景知识,适合在需要了解某个意象(如“雪”)的全面历史文化背景时使用。
- **典型例子**`"《三五曆記》曰:未有天地之時,混沌狀如雞子,溟涬始牙..."`
- **《艺文类聚》**
- **内容与编排顺序**:按天、岁时、地理、帝王、人、乐、职官等编排。
- **特点**:事文交织。词条收录较广,既有经史中的“叙事”,也有大量的历代【诗】、【赋】、【赞】。
- **整理问题**:带有原书的标点和分段标记,格式清晰。
- **辅助创作价值**:极好的文学创作资料库,帮助创作者一站式看到某个主题在古代诗文中的各种形态。
- **典型例子**`"【詩】晉傅玄《兩儀詩》曰:兩儀始分.元氣上清.列宿垂象.六位時成..."`
- **《玉海》**
- **内容与编排顺序**:详分天文、地理、典章制度等。
- **特点**:词条常为长篇大论,注重典章制度、天文地理的详细考证。
- **整理问题**:存在词条名拆分或提取不精准的问题(如把“中宫二十八舍”拆断处理)。正文缺乏标点。
- **辅助创作价值**:提供精准宏大的制度与天文星象知识,适合创作偏严肃或庙堂题材的诗歌。
- **典型例子**`"中宫": "漢天文志(史天官書同)中宫天極星其一明者泰一之常居也旁三星三公..."`
- **《渊鉴类函》**
- **内容与编排顺序**:按大部类排布。
- **特点**:清代集大成之作,将引文明确区分为“原”(原类书已有)与“增”(清代新增)。
- **整理问题**:使用空格作为句读分隔,未见全角标点。
- **辅助创作价值**:覆盖面最广的兜底宝库,适合查阅各种意象的演变和最全面的引文集合。
- **典型例子**`"原釋名曰天坦也坦然髙而逺也 增又曰天顯也在上髙顯也..."`
## 二、韵式
这类类书专为押韵而生,以“韵母”或“韵字”为一级分类,适合在写格律诗卡壳、需要找特定韵脚词汇时使用。
- **《佩文韵府》**
- **内容与编排顺序**:按平水韵分类(如“一东”),下系以该字为尾的各种词条及摘句。
- **特点**:非常详细,包含声调、韵部说明,以及海量的带出处短句。以元代《韵府群玉》和明代《五车韵瑞》为基础增补。
- **整理问题**JSON结构层次非常清晰。使用“丨”符号代替原韵字如“東”被替换为“丨”
- **辅助创作价值****写诗必备神器**。想用“东”韵时,能瞬间获得大量以东结尾的词汇(如“南东”、“活东”)及例句,极大辅助押韵。
- **典型例子**`"(韵母)东": { "小韵描述": "东德红切眷方也...", "词条": { "活東": "爾雅科斗丨丨蝦蟇也...", "牆東": "後漢書避世丨丨王君公..." } }`
- **《韵府群玉》**
- **内容与编排顺序**:按大韵分类,列出小韵和具体词条。
- **特点**:早期的韵书,条目较为简练紧凑。
- **整理问题**:条目内容被尖括号`〈〉`包裹,夹杂部分注音(如“徳紅切”)。
- **辅助创作价值**:与佩文韵府同理,但体量更小,适合快速查阅核心的传统押韵典故。
- **典型例子**`"東": { "道東": "〈漢鄭𤣥事馬融辭歸融曰吾道東矣本〉" }`
- **《五车韵瑞》**
- **内容与编排顺序**/
- **特点**/
- **整理问题****严重问题**,当前文件夹内的 `allorigins.json` 数据获取失败,内容实际上是 Nginx 的 `500 Internal Server Error` 报错网页代码并非JSON数据。
- **辅助创作价值**:暂时无价值。需要修复爬虫和数据源。
- **典型例子**`<html><head><title>500 Internal Server Error</title></head><body>...`