Jump to content
Ketarin forum
VietOCR3 (Java)
Guest
By Guest, 12/12/2021
  • 8 downloads
  • Updated:

File Details

  • Website URL https://sourceforge.net/projects/vietocr/files/vietocr/{ver}/
  • User Agent
  • Category офис (office) / OCR
  • User Notes VietOCR (Java) сканирование и распознавание vietocr.sourceforge.net Язык: Русский Лицензия: Apache License v2.0 Графический интерфейс для движка Tesseract OCR Инструмент для сканирования и распознавания документов. Графический интерфейс для движка Tesseract OCR. Поддержка оптического распознавания символов для вьетнамских и других языков, поддерживаемых Tesseract. Переведен на русский язык. VietOCR распространяется под Apache License v2.0. Особенности: - Форматы изображений PDF, TIFF, JPEG, GIF, PNG, BMP; - Многостраничные TIFF изображения; - Поле выбора фрагмента; - Поддержка drag-and-drop; - Вставить изображение из буфера обмена; - Распознавание русского языка (после загрузки словаря); - Локализованный пользовательский интерфейс на многие языки; - Встроенная поддержка сканирования; - Монитор папок для поддержки пакетной обработки; - Пользовательская замена текста в постобработке; - Проверка орфографии с Hunspell; - Поддержка загрузки и установки пакетов языков и соответствующих словарей орфографии. Локализация VietOCR Для перевода интерфейса на русский язык необходимо перейти во вкладку "Settings", далее выбираем "User Interface Language", и там указываем "Russia (русский)". Также необходимо загрузить словари русского языка для распознавания. Для этого переходим во вкладку "Настройки", и выбираем "Скачать данные по языкам". Там необходимо выбрать "Russian" и нажимаем "Скачать". Перед распознаванием необходимо выбрать язык распознавания. Для этого необходимо указать нужный язык в выпадающем меню, в верхней правой части окна VietOCR. A Java/.NET GUI frontend for Tesseract OCR engine. Supports optical character recognition for Vietnamese and other languages supported by Tesseract. VietOCR is released and distributed under the Apache License, v2.0. Features: - Multi-platform (Java version only) - Windows - Solaris - Linux/Unix - Mac OS X - Others - PDF, TIFF, JPEG, GIF, PNG, BMP image formats - Multi-page TIFF images - Screenshots - Selection box - File drag-and-drop - Paste image from clipboard - Postprocessing for Vietnamese to boost accuracy rate - Vietnamese input methods - Localized user interface for many languages (Localization project) - Integrated scanning support - Watch folder monitor for support of batch processing - Custom text replacement in postprocessing - Spellcheck with Hunspell - Support for downloading and installing language data packs and appropriate spell dictionaries

(Show)XML Contents

            <?xml version="1.0" encoding="utf-8"?>
<Jobs>
  <ApplicationJob xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" Guid="7df48a46-0222-48a5-90cd-21e20fce9b47">
    <Category>офис (office) / OCR</Category>
    <WebsiteUrl>https://sourceforge.net/projects/vietocr/files/vietocr/{ver}/</WebsiteUrl>
    <UserAgent/>
    <UserNotes>VietOCR (Java)
сканирование и распознавание
vietocr.sourceforge.net
 
  Язык: Русский
  Лицензия: Apache License v2.0
 
  Графический интерфейс для движка Tesseract OCR
  Инструмент для сканирования и распознавания документов. Графический интерфейс для движка Tesseract OCR. Поддержка оптического
распознавания символов для вьетнамских и других языков, поддерживаемых Tesseract. Переведен на русский язык.
  VietOCR распространяется под Apache License v2.0.
 
  Особенности:
 - Форматы изображений PDF, TIFF, JPEG, GIF, PNG, BMP;
 - Многостраничные TIFF изображения;
 - Поле выбора фрагмента;
 - Поддержка drag-and-drop;
 - Вставить изображение из буфера обмена;
 - Распознавание русского языка (после загрузки словаря);
 - Локализованный пользовательский интерфейс на многие языки;
 - Встроенная поддержка сканирования;
 - Монитор папок для поддержки пакетной обработки;
 - Пользовательская замена текста в постобработке;
 - Проверка орфографии с Hunspell;
 - Поддержка загрузки и установки пакетов языков и соответствующих словарей орфографии.
 
  Локализация VietOCR
  Для перевода интерфейса на русский язык необходимо перейти во вкладку "Settings", далее выбираем
"User Interface Language", и там указываем "Russia (русский)".
  Также необходимо загрузить словари русского языка для распознавания. Для этого переходим во вкладку
"Настройки", и выбираем "Скачать данные по языкам". Там необходимо выбрать "Russian" и нажимаем "Скачать".
  Перед распознаванием необходимо выбрать язык распознавания. Для этого необходимо указать нужный язык
в выпадающем меню, в верхней правой части окна VietOCR.
 
  A Java/.NET GUI frontend for Tesseract OCR engine. Supports optical character recognition for
Vietnamese and other languages supported by Tesseract.
  VietOCR is released and distributed under the Apache License, v2.0.
 
  Features:
 - Multi-platform (Java version only)
   - Windows
   - Solaris
   - Linux/Unix
   - Mac OS X
   - Others
 - PDF, TIFF, JPEG, GIF, PNG, BMP image formats
 - Multi-page TIFF images
 - Screenshots
 - Selection box
 - File drag-and-drop
 - Paste image from clipboard
 - Postprocessing for Vietnamese to boost accuracy rate
 - Vietnamese input methods
 - Localized user interface for many languages (Localization project)
 - Integrated scanning support
 - Watch folder monitor for support of batch processing
 - Custom text replacement in postprocessing
 - Spellcheck with Hunspell
 - Support for downloading and installing language data packs and appropriate spell dictionaries
</UserNotes>
    <LastFileSize>23721157</LastFileSize>
    <LastFileDate>2022-12-05T02:38:20.1295544</LastFileDate>
    <IgnoreFileInformation>true</IgnoreFileInformation>
    <DownloadBeta>Default</DownloadBeta>
    <DownloadDate xsi:nil="true"/>
    <CheckForUpdatesOnly>false</CheckForUpdatesOnly>
    <VariableChangeIndicator>ver</VariableChangeIndicator>
    <HashVariable/>
    <HashType>None</HashType>
    <CanBeShared>true</CanBeShared>
    <ShareApplication>true</ShareApplication>
    <ExclusiveDownload>false</ExclusiveDownload>
    <HttpReferer/>
    <SetupInstructions/>
    <Variables>
      <item>
        <key>
          <string>ver</string>
        </key>
        <value>
          <UrlVariable>
            <RegexRightToLeft>false</RegexRightToLeft>
            <VariableType>RegularExpression</VariableType>
            <Regex>(?<=Parent folder.*?<tr title="*?)(\d+(?:[.|_|-][\d|\w]+)*)</Regex>
            <Url>https://sourceforge.net/projects/vietocr/files/vietocr/</Url>
            <Name>ver</Name>
          </UrlVariable>
        </value>
      </item>
      <item>
        <key>
          <string>url1</string>
        </key>
        <value>
          <UrlVariable>
            <RegexRightToLeft>false</RegexRightToLeft>
            <VariableType>RegularExpression</VariableType>
            <Regex>ResponseUri: ([^"]+\.zip)</Regex>
            <Url>{part_url}</Url>
            <Name>url1</Name>
          </UrlVariable>
        </value>
      </item>
      <item>
        <key>
          <string>part_url</string>
        </key>
        <value>
          <UrlVariable>
            <RegexRightToLeft>false</RegexRightToLeft>
            <VariableType>RegularExpression</VariableType>
            <Regex>href="(([^"]+.zip/download))"</Regex>
            <Url>https://sourceforge.net/projects/vietocr/files/vietocr/{ver}/</Url>
            <Name>part_url</Name>
          </UrlVariable>
        </value>
      </item>
      <item>
        <key>
          <string>url</string>
        </key>
        <value>
          <UrlVariable>
            <RegexRightToLeft>false</RegexRightToLeft>
            <VariableType>Textual</VariableType>
            <Regex/>
            <TextualContent>https://master.dl.sourceforge.net/project/vietocr/vietocr/{ver}/VietOCR-{ver}.zip</TextualContent>
            <Name>url</Name>
          </UrlVariable>
        </value>
      </item>
    </Variables>
    <ExecuteCommand/>
    <ExecutePreCommand/>
    <ExecuteCommandType>Batch</ExecuteCommandType>
    <ExecutePreCommandType>Batch</ExecutePreCommandType>
    <SourceType>FixedUrl</SourceType>
    <PreviousLocation/>
    <DeletePreviousFile>true</DeletePreviousFile>
    <Enabled>true</Enabled>
    <FileHippoId/>
    <LastUpdated>2022-12-05T02:38:20.1295544</LastUpdated>
    <TargetPath>D:\--software\!@__office\!@__ocr__scan__postproc\@__03_ocr\</TargetPath>
    <FixedDownloadUrl>{url}</FixedDownloadUrl>
    <Name>VietOCR3 (Java)</Name>
  </ApplicationJob>
</Jobs>

        

Comments

There are no comments to display.

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Add your comment...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Loading...


×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.