Files
spider-ctext/README.md
2026-03-22 17:51:04 +08:00

91 lines
8.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 类书分类与特点梳理
## 一、词条式
这类类书通常以主题(如天文地理、自然物候、官职礼法等)分类,适合根据意象(如“雪”、“月”)进行正向检索找语料。
- 《白孔六帖》【完成】
- **内容与编排顺序**:按天文地理、历法礼仪、生活物件等类目编排。
- **特点**:采辑各种典籍中的成语、典故、短语,多为四字短句,并附带简短的释义。
- **整理问题**:原文缺乏条理性,多为词语与简短释义的罗列,有点不知所云
- **辅助创作价值**:可作为提炼“四字骈语”或冷僻典故的原始素材库。
- **典型例子**`"content": "白髙眀柔克(髙明天也柔克寒暑不干)隂隲下民(言天黙定下民之命)天尊(地卑)..."`
- 《北堂书钞》【完成】
- **内容与编排顺序**:按帝王、后妃、政术、刑法、官职、礼仪等社会制度与名物编排。
- **特点**:成书于隋,引用起自三代、汉、魏,迄于宋、齐。侧重于对概念的追本溯源,对词条解释较为详细。
- **整理问题**:正文部分缺乏标点,长句粘连。
- **辅助创作价值**:古朴凝练。如创作者需要引用较为正统的经史概念(如写咏史诗),该书能提供最原汁原味的早期语料。
- **典型例子**`"section": "帝王","content": "天命𤣥鳥降而生商 有娀方將帝立子生高 誕彌厥月先生如達不坼不副無灾無害 生此文王 篤生武王 生於翼下 產於危辰 `
- [x]**《初学记》**【完成】
- **内容与编排顺序**:按天、岁时、官职、地理等编排。每个词条下细分为“叙事”、“事对”、“诗文”。
- **特点**:词条内容非常详细、层次分明,具有极强的结构化特征。
- **整理问题**整理得非常干净JSON层级保留了原始分类结构。但没有标点。
- **辅助创作价值****价值极高**。“叙事”提供了详细的字词解释,“事对”直接提供了现成的对仗词汇(写诗利器);“诗文”栏目则方便查阅前人咏此物的范本。`
- **典型例子**`"雨": { "叙事": "釋名云雨水從雲下也雨者輔也言輔時生養尚書曰休徴曰肅時雨若(休美也肅敬也若順也孔安國注云君行敬則時雨順)……", "事对": "離畢 化坎(毛詩云月離于畢俾滂沱矣畢月屬也月離隂星則雨鄭𤣥注曰將有大雨徵先見於天周易集林雜占曰占天雨否外卦得隂為雨得陽不雨其爻發變得坎為雨得離不雨巽化為坎先風後雨坎化為巽先雨後風)鸛鳴 魚噞……", "诗文": "賦晉潘尼苦雨賦(氣觸石而結蒸雲膚合而仰浮雨紛射而下注……" }`
- 《海录碎事》【完成】
- **内容与编排顺序**:按天、地、衣冠、人等分类。
- **特点**:每一类下词条过细(常为生僻两字词),每一词条下内容极少,通常只有一两句包含该词的引文。
- **整理问题**:词条过度碎片化,键名就是细碎的生僻词汇。
- **辅助创作价值**:或许可以当做一个“逆向用词示例库”。诗人想用某个生僻意象时,用它查看古人如何将其嵌入诗句中。
- **典型例子**`"曽穹": [{"content": "蹀足循廣除瞬目矖曽穹(文選謝惠連詩)"}]`
- 《骈字类编》【完成】
- **内容与编排顺序**:按天地、时令、山水、珍宝、器物等词汇大类编排。
- **特点**:专收“骈语”(双音节词),词条极多,详细列出了该词在各路经史子集中出现的位置。
- **整理问题**:长段引文粘连,缺少现代标点。
- **辅助创作价值**:列出的大量双音词汇能为诗人提供丰富的对仗词汇和典故来源。
- **典型例子**`"天地": "易干夫大人者与天地合其德 又坤天地变化草木蕃天地闭贤人隐 又泰象曰天地交泰后以财成天地之道辅相天地之宜以左右民..."`
- [x]**《太平御览》**【完成】
- **内容与编排顺序**:以天、地、人、事、物为大类顺序。
- **特点**:在前代《修文殿御览》《艺文类聚》等书基础上编纂而成,包罗万象。词条内容全部为带出处的原文引文。很像《艺文类聚》,但词条没有《艺文类聚》精练。
- **整理问题**:部分词条识别有误。
- **辅助创作价值**:价值较高。提供最详实的事物背景知识,适合在需要了解某个意象(如“雪”)的全面历史文化背景时使用。
- **典型例子**`"元气": {"content": "《三五曆記》曰:未有天地之時,混沌狀如雞子,溟涬始牙, 濛〈莫孔切。〉鴻〈胡孔切。〉滋萌,歲在攝提,元氣肇始。\n\n又曰..."}`
- [x]**《艺文类聚》**【完成】
- **内容与编排顺序**:按天、岁时、地理、帝王、人、乐、职官等编排。
- **特点**:事文交织。词条收录较广,既有经史中的“叙事”,也有大量的历代诗、赋、赞等。很像《太平御览》,但收录范围没有《太平御览》广。
- **整理问题**:带有原书的标点和分段标记,格式清晰。
- **辅助创作价值**:极好的文学创作资料库,帮助创作者一站式看到某个主题在古代诗文中的各种形态。
- **典型例子**`"【詩】晉傅玄《兩儀詩》曰:兩儀始分.元氣上清.列宿垂象.六位時成..."`
- 《玉海》【完成】
- **内容与编排顺序**:详分天文、地理、典章制度等。
- **特点**:词条常为字数很多的专有名词(如“周易分星野图”“至和列象拱極"),注重典章制度、天文地理的详细考证。
- **整理问题**:正文缺乏标点。
- **辅助创作价值**:提供精准宏大的制度与天文星象知识,适合创作偏严肃或庙堂题材的诗歌。
- **典型例子**`"中宫": "漢天文志(史天官書同)中宫天極星其一明者泰一之常居也旁三星三公..."`
- 《渊鉴类函》【完成】
- **内容与编排顺序**:按天、地、岁时、帝王、设官等大部类排布。
- **特点**:清代集大成之作,将引文明确区分为“原”(原类书已有)与“增”(清代新增)。
- **整理问题**:使用空格作为句读分隔,未见全角标点; 内容比较模糊,可读性较差。
- **辅助创作价值**:覆盖面较广,适合查阅各种意象的演变和最全面的引文集合。
- **典型例子**`"天一": "原釋名曰天坦也坦然髙而逺也 增又曰天顯也在上髙顯也 原物理論曰水土之氣升而為天 增又曰天者旋也均也積陽純剛其體廻旋羣生之所大仰原廣雅曰太初氣之始也清濁未分太始形之始也..."`
- 《文苑英华》【未完成】
- 没有合格的原文件:维基文库仅四卷;电子书计划全,但爬不下来。
## 二、韵式
这类类书专为押韵而生,以“韵字”为一级分类,适合在写格律诗卡壳、需要找特定韵脚词汇时使用。
- [x]**《佩文韵府》**【完成】
- **内容与编排顺序**:按平水韵分类(如“一东”),下系以该字为尾的各种词条及摘句。
- **特点**:非常详细,包含声调、韵部说明,以及海量的带出处短句。以元代《韵府群玉》和明代《五车韵瑞》为基础增补。
- **整理问题**JSON结构层次非常清晰。但有部分生僻韵字未被识别藏在其他韵字的韵藻里。也没有标点。
- **辅助创作价值****价值极高**。想用“东”韵时,能瞬间获得大量以东结尾的词汇(如“南东”、“活东”)及例句,极大辅助押韵。
- **典型例子**`"(韵母)东": { "小韵描述": "东德红切眷方也...", "词条": { "活東": "爾雅科斗丨丨蝦蟇也...", "牆東": "後漢書避世丨丨王君公..." } }`
- 《韵府群玉》【完成】
- **内容与编排顺序**:按大韵分类,列出小韵和具体词条。
- **特点**:类似于《佩文韵府》,但体量更小。
- **整理问题**:部分韵字有多音问题;没有空格或标点,阅读体验较差。
- **辅助创作价值**:与佩文韵府同理,但体量更小,适合快速查阅核心的传统押韵典故。
- **典型例子**`"東": { "道東": "〈漢鄭𤣥事馬融辭歸融曰吾道東矣本〉" }`
- 《五车韵瑞》【未完成】
- 当前文件夹内的 `allorigins.json` 数据获取失败,内容实际上是 Nginx 的 `500 Internal Server Error` 报错网页代码并非JSON数据。
- 没有合格的源数据电子书计划ctext和识典古籍均为很粗糙的OCR识别结果几乎不可用且两个网站反爬机制十分严格。