分类:全文档编辑器

来自Big Physics
Jinshanw讨论 | 贡献2022年5月28日 (六) 19:42的版本
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)


取名:构书,striting?含义是:结构化写作,structual writing

目前的记笔记、管理知识、写作(日常文档写作、论文写作、小说写作)、编写软件文档有多种格式,例如LaTeX(包含其子集MathJax), markdown, rst, html, mediaWiki, Mindmap, Concept Map,Flow Chart,但是往往这些格式不能嵌套使用,也不能简单地实现相互转化。

我希望能够做一个全格式的协作写作和知识管理平台平台,并且,适合各种目的的写作需求,同时方便编辑、整理和使用概念地图。全格式的意思就是以上任何一种格式都可以混用。例如,在\begin{md} \end{md}之间的就是markdown语法的内容,在\begin{cmap} \end{cmap}之间的就是概念地图的内容。然后,各自交给相应的服务器来解释和生成最终文档,以及格式的相互转化。整个平台坚持用文本标记语言,不用文字处理软件(坚决不提供所见即所得文字编辑界面,坚持提供分开的文本编辑界面和预览界面)。坚持一切都是看得见的txt。协作的意思就是允许多人同时编辑,并且这里的多人可以包含作者、编辑、排版人员,同时做好版本控制。另外,也可以制作一些文档模板,例如简单笔记的、包含概念地图的笔记的、可以出版的书、html网页的、菜单的、买菜清单的。争取做到绝大多数作者都可以不懂语法,写作的时候按照给定格式填空就行。知识管理就是明确把概念、概念之间的联系当做内容骨架,用概念地图的方式明确显示出来。

额外功能:提供转化成word(拒绝反过来把word转化成格式标记语言,或者提供此功能,但是,必须让用户在此基础上修改)。

潜在用户:做简单笔记的用户、开展深度学习需要做笔记的用户、网络写手、科研论文作者、书的作者和编辑。尤其是科研论文作者和出版行业的编辑,会是这个系统的非常有潜力的付费用户。

长期来看,甚至可以将来结合到小说阅读、科研论文评审和发布、书的出版(甚至预览和销售)流程、专门领域写作资料整理和提供等等。


一些功能细节: 对于书的写作和编辑流程来说,每一个协作参与者在哪个版本上在什么时间改动了什么,一定要生成一个列表。因此,需要给用户选择一个文档是否具有完整的版本控制功能,而且就算有,这个版本控制功能也是放在这个系统的后面的,以辅助文档的形式存在,而不需要用户直接面对这个版本控制系统(这个只有对程序员是可以接受的,一般用户会被吓死)。

是否出版界还有其他格式的需求,以及相应的格式转化是否已经有已经做好的模块。

语法自动修改:基于自然语言处理(NLP)可以做一个自动识别错别字、不通顺的语句、含义不明确的语句的识别器。其实在英文已经有这样的工具了(afterdeadline, grammerly)。中文的,需要借鉴英文那个重新做。另外,是否可以通过预测模型来找错呢(假设,如果实际出现的在预测模型中概率很低,则要么是错误,要么是创新?)?

考虑内嵌几个常用表格模板,对用户更友好。

自动生成国标文献格式,参考谷歌学术、必应学术、百度学术等的CITE文献功能。LaTeX下可以用参考文献文件bib和参考文献格式文件bst自动生成和管理(除了用文本编辑器,其他专门软件JabRef, RefWorks等等可以编辑和管理bib文件)。其他标记语言下不知道怎么办。不过,正好,可以要求提供bib文件,用LaTeX辅助其他标记语言。

做faq(最没有经验的写手来根据其写做提问,最有经验的写手来回答,这部分可以众包),并做一个自然语言处理写作助手机器人来匹配问题和答案,以及收集新问题。

概念专有名词等实体索引的自动标记和生成,文本线性概念轴和概念联系的自动识别,用于帮助作者的结构化写作和在写作中考虑好前后概念联系。同时,这个自动构建的轴型概念地图也可以交给用户编辑。 用户设置分享链接的权限和时效性。这部分功能可以和“团队知识库”相联系。同时,像Wikipedia其实背后是一个概念网络,但是却没有把概念网络明确呈现出来。我们希望知识管理和概念网络能够完全结合起来。

做一个pdf2latex翻译器?基于arxiv上的latex文件?不过得到的latex是否可读是个问题。有这个软件至少可以保证各种转换可以通过pdf来做。

卖点:协作,全格式,无需安装浏览器上使用,一切都是文本,结构化写作(作者只需要说清楚是什么,格式由专门的模板来负责;先构思整体结构,再加入骨架性内容,接着补充细节),自然语言处理辅助,易用性(多种模板,从只需填空的用户到专业用户,AI写作助手),无缝连接出版,直接用于知识管理。

几乎所见即所得版本的编辑器:要求用户每次都给出内容的逻辑定位,例如,插入章,插入节,插入图片,插入方程,插入动画、插入列表、插入参考文献,同时系统生成相应的格式化文件以及每个逻辑定位的标签。也就是说,背后是xml,latex之类的格式文件,前端套上模板以后,看起来有所见即所得的效果。

本分类目前不含有任何页面或媒体文件。