数式用のOCRライブラリ

Ocr Lib Math Formulas

SESHATは、手書きの数式を認識するためにC ++で記述されたオープンソースシステムです。 SESHATは、UniversitatPolitècnicadeValènciaのPRHLT研究センターで博士論文の一部として開発されました。

オンラインデモ：http：//cat.prhlt.upv.es/mer/

ソース：https：//github.com/falvaro/seshat

Seshatは、手書きの数式を認識するためのオープンソースシステムです。ストロークのシーケンスとして表されるサンプルが与えられると、パーサーはそれをLaTeXまたはInkMLやMathMLなどの他の形式に変換できます。

Metaoptimizeの回答とTesseractメーリングリストの議論によると、それを実行できるオープン/無料のソリューションはまだないようです。

それを実行できると思われる唯一の解決策（ただし、Windowsのみで無料ではないため、確認できません）は、他の数人が言及しているように、InftyProjectです。

私が知っているのはInftyReaderだけです。それは自由ソフトウェアではありません（お金は非営利組織、IIRCに行くようです）。

http://www.sciaccess.net/en/InftyReader/

PDFがLaTeXにメタデータを持つことができない理由がわかりませんか？のように：LaTeX方程式をその中に入れてください！これはとても難しいですか？（PDF構文については何も知りませんが、できると思います）。

LaTeX構文は、数学表記の1つの試行錯誤の標準です。 MathMLやその他のものを作成した人々がこれを考慮に入れていないのは驚くほど愚かなようです。 InftyReaderはMathMLまたはLaTeX構文を生成します。

HTML（純粋）が必要な場合は、TTHを使用してLaTeX構文を読み取ります。うまくいきます。

ABBYY FineReader（優れたOCRプログラム）は、数学用のソフトウェアをトレーニングできると主張していますが、これは非常に頭がおかしいです（誰に時間がありますか？）

そしてUnicodeにはたくさんの数学記号があります。今日のOCRリーダーがそれらを理解できないということは、ソフトウェアの残念な状態とこの活動における脳の不足を示しています。

「一度に1つのシンボル」に関しては、TeXには明らかにシンボルを配置する場所に関する規則があります。彼らはそれらのルールを知っているソフトウェアを書くことができませんか？！ TeXはパブリックドメインです！彼らは彼らの商業製品でただ「それを使う」ことができます。

カテゴリー