CuneiForm (OpenOCR) - это программа распознавания текста для печатных шаблонов. Рукописи или PDF-файлы программа может не распознавать, однако, кроме табличных структур. Языковая модель применима для 20 языков, а результаты можно использовать в качестве текста HTML, RTF или ASCII для сохранения или экспорта напрямую в Word или Excel. Эти шрифты есть, а структура документа неизменна. CuneiForm только недавно сделал программное обеспечение с открытым исходным кодом. Он был разработан российской компанией Cognitive Technologies и означает что-то вроде клинописи (от англ. Клинопись = клиновидная).
Только с апреля 2008 года коммерческое использование возможно, поскольку исходный код доступен только с 2008 года. По Юсси Пакканен существует портативная версия CuneiForm. Операционная система: Linux, BSD, Mac OS X и Windows.
Поддержка 20 языков: английский, немецкий, французский, испанский, итальянский, португальский, голландский, русский, смешанный русско-английский, украинский, датский, шведский, финский, сербский, хорватский, польский и другие.