5 lines
875 B
Markdown
5 lines
875 B
Markdown
地址
|
||
- 识典古籍 https://www.shidianguji.com/book/CADAL02059421/chapter/1lmkv1qwgsj7a?version=2
|
||
- 中国哲学电子书计划 https://ctext.org/wiki.pl?if=gb&res=87723&remap=gb
|
||
- 这两个网站上《五车韵瑞》的数据都属于“未经人工校对的原始机器OCR乱码文本”,并且两家网站都部署了极高规格的反爬虫机制。当前状态下,无法直接通过云端服务器一次性生成高质量的全书 JSON。
|
||
- 如果你想获得《五车韵瑞》那样高质量的结构化数据,我建议:寻找哈佛燕京图书馆或书格(Shuge.org)上的《佩文韵府》或《五车韵瑞》的高清 PDF 影印本,然后使用现代先进的古籍专用大模型(如 读史大模型、GPT-4o Vision)重新进行高质量的 OCR 识别和 JSON 结构化拆分。直接解析现有的这两个站点的破损 OCR 是无用功。 |