VietOCR3 (Java)
By Guest, 12/12/2021
- 8 downloads
- Updated:
File Details
- Website URL https://sourceforge.net/projects/vietocr/files/vietocr/{ver}/
- User Agent
- Category офис (office) / OCR
- User Notes VietOCR (Java) сканирование и распознавание vietocr.sourceforge.net Язык: Русский Лицензия: Apache License v2.0 Графический интерфейс для движка Tesseract OCR Инструмент для сканирования и распознавания документов. Графический интерфейс для движка Tesseract OCR. Поддержка оптического распознавания символов для вьетнамских и других языков, поддерживаемых Tesseract. Переведен на русский язык. VietOCR распространяется под Apache License v2.0. Особенности: - Форматы изображений PDF, TIFF, JPEG, GIF, PNG, BMP; - Многостраничные TIFF изображения; - Поле выбора фрагмента; - Поддержка drag-and-drop; - Вставить изображение из буфера обмена; - Распознавание русского языка (после загрузки словаря); - Локализованный пользовательский интерфейс на многие языки; - Встроенная поддержка сканирования; - Монитор папок для поддержки пакетной обработки; - Пользовательская замена текста в постобработке; - Проверка орфографии с Hunspell; - Поддержка загрузки и установки пакетов языков и соответствующих словарей орфографии. Локализация VietOCR Для перевода интерфейса на русский язык необходимо перейти во вкладку "Settings", далее выбираем "User Interface Language", и там указываем "Russia (русский)". Также необходимо загрузить словари русского языка для распознавания. Для этого переходим во вкладку "Настройки", и выбираем "Скачать данные по языкам". Там необходимо выбрать "Russian" и нажимаем "Скачать". Перед распознаванием необходимо выбрать язык распознавания. Для этого необходимо указать нужный язык в выпадающем меню, в верхней правой части окна VietOCR. A Java/.NET GUI frontend for Tesseract OCR engine. Supports optical character recognition for Vietnamese and other languages supported by Tesseract. VietOCR is released and distributed under the Apache License, v2.0. Features: - Multi-platform (Java version only) - Windows - Solaris - Linux/Unix - Mac OS X - Others - PDF, TIFF, JPEG, GIF, PNG, BMP image formats - Multi-page TIFF images - Screenshots - Selection box - File drag-and-drop - Paste image from clipboard - Postprocessing for Vietnamese to boost accuracy rate - Vietnamese input methods - Localized user interface for many languages (Localization project) - Integrated scanning support - Watch folder monitor for support of batch processing - Custom text replacement in postprocessing - Spellcheck with Hunspell - Support for downloading and installing language data packs and appropriate spell dictionaries
(Show)XML Contents
<?xml version="1.0" encoding="utf-8"?> <Jobs> <ApplicationJob xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" Guid="7df48a46-0222-48a5-90cd-21e20fce9b47"> <Category>офис (office) / OCR</Category> <WebsiteUrl>https://sourceforge.net/projects/vietocr/files/vietocr/{ver}/</WebsiteUrl> <UserAgent/> <UserNotes>VietOCR (Java) сканирование и распознавание vietocr.sourceforge.net Язык: Русский Лицензия: Apache License v2.0 Графический интерфейс для движка Tesseract OCR Инструмент для сканирования и распознавания документов. Графический интерфейс для движка Tesseract OCR. Поддержка оптического распознавания символов для вьетнамских и других языков, поддерживаемых Tesseract. Переведен на русский язык. VietOCR распространяется под Apache License v2.0. Особенности: - Форматы изображений PDF, TIFF, JPEG, GIF, PNG, BMP; - Многостраничные TIFF изображения; - Поле выбора фрагмента; - Поддержка drag-and-drop; - Вставить изображение из буфера обмена; - Распознавание русского языка (после загрузки словаря); - Локализованный пользовательский интерфейс на многие языки; - Встроенная поддержка сканирования; - Монитор папок для поддержки пакетной обработки; - Пользовательская замена текста в постобработке; - Проверка орфографии с Hunspell; - Поддержка загрузки и установки пакетов языков и соответствующих словарей орфографии. Локализация VietOCR Для перевода интерфейса на русский язык необходимо перейти во вкладку "Settings", далее выбираем "User Interface Language", и там указываем "Russia (русский)". Также необходимо загрузить словари русского языка для распознавания. Для этого переходим во вкладку "Настройки", и выбираем "Скачать данные по языкам". Там необходимо выбрать "Russian" и нажимаем "Скачать". Перед распознаванием необходимо выбрать язык распознавания. Для этого необходимо указать нужный язык в выпадающем меню, в верхней правой части окна VietOCR. A Java/.NET GUI frontend for Tesseract OCR engine. Supports optical character recognition for Vietnamese and other languages supported by Tesseract. VietOCR is released and distributed under the Apache License, v2.0. Features: - Multi-platform (Java version only) - Windows - Solaris - Linux/Unix - Mac OS X - Others - PDF, TIFF, JPEG, GIF, PNG, BMP image formats - Multi-page TIFF images - Screenshots - Selection box - File drag-and-drop - Paste image from clipboard - Postprocessing for Vietnamese to boost accuracy rate - Vietnamese input methods - Localized user interface for many languages (Localization project) - Integrated scanning support - Watch folder monitor for support of batch processing - Custom text replacement in postprocessing - Spellcheck with Hunspell - Support for downloading and installing language data packs and appropriate spell dictionaries </UserNotes> <LastFileSize>23721157</LastFileSize> <LastFileDate>2022-12-05T02:38:20.1295544</LastFileDate> <IgnoreFileInformation>true</IgnoreFileInformation> <DownloadBeta>Default</DownloadBeta> <DownloadDate xsi:nil="true"/> <CheckForUpdatesOnly>false</CheckForUpdatesOnly> <VariableChangeIndicator>ver</VariableChangeIndicator> <HashVariable/> <HashType>None</HashType> <CanBeShared>true</CanBeShared> <ShareApplication>true</ShareApplication> <ExclusiveDownload>false</ExclusiveDownload> <HttpReferer/> <SetupInstructions/> <Variables> <item> <key> <string>ver</string> </key> <value> <UrlVariable> <RegexRightToLeft>false</RegexRightToLeft> <VariableType>RegularExpression</VariableType> <Regex>(?<=Parent folder.*?<tr title="*?)(\d+(?:[.|_|-][\d|\w]+)*)</Regex> <Url>https://sourceforge.net/projects/vietocr/files/vietocr/</Url> <Name>ver</Name> </UrlVariable> </value> </item> <item> <key> <string>url1</string> </key> <value> <UrlVariable> <RegexRightToLeft>false</RegexRightToLeft> <VariableType>RegularExpression</VariableType> <Regex>ResponseUri: ([^"]+\.zip)</Regex> <Url>{part_url}</Url> <Name>url1</Name> </UrlVariable> </value> </item> <item> <key> <string>part_url</string> </key> <value> <UrlVariable> <RegexRightToLeft>false</RegexRightToLeft> <VariableType>RegularExpression</VariableType> <Regex>href="(([^"]+.zip/download))"</Regex> <Url>https://sourceforge.net/projects/vietocr/files/vietocr/{ver}/</Url> <Name>part_url</Name> </UrlVariable> </value> </item> <item> <key> <string>url</string> </key> <value> <UrlVariable> <RegexRightToLeft>false</RegexRightToLeft> <VariableType>Textual</VariableType> <Regex/> <TextualContent>https://master.dl.sourceforge.net/project/vietocr/vietocr/{ver}/VietOCR-{ver}.zip</TextualContent> <Name>url</Name> </UrlVariable> </value> </item> </Variables> <ExecuteCommand/> <ExecutePreCommand/> <ExecuteCommandType>Batch</ExecuteCommandType> <ExecutePreCommandType>Batch</ExecutePreCommandType> <SourceType>FixedUrl</SourceType> <PreviousLocation/> <DeletePreviousFile>true</DeletePreviousFile> <Enabled>true</Enabled> <FileHippoId/> <LastUpdated>2022-12-05T02:38:20.1295544</LastUpdated> <TargetPath>D:\--software\!@__office\!@__ocr__scan__postproc\@__03_ocr\</TargetPath> <FixedDownloadUrl>{url}</FixedDownloadUrl> <Name>VietOCR3 (Java)</Name> </ApplicationJob> </Jobs>