Beschreibung ID Generierung fr TBX Dateien
===========================================
Autor: Dr. Klemens Waldhr - fr beo

java -cp ".;lib\OpenTMS.jar;lib\external.jar;" -Djava.library.path="\Win32" -Xmx1000M de.folt.models.documentmodel.tbx.TbxDocument   
Usage: java -jar <jarfiles> de.folt.models.documentmodel.tbx.TbxDocument <infile tbx> [outfile tbx]

jar Dateien:
------------
Bentigte jar Dateien: lib/openTMS.jar; lib/external.jar

REM set OPENTMSBASEDIR=c:\Program Files\OpensTMS
set OPENTMSBASEDIR=.
set OPENTMSJAVABASE=-cp ".;lib\OpenTMS.jar;lib\external.jar;" -Djava.library.path="%OPENTMSLIBDIR%\Win32"
java %OPENTMSJAVABASE% -Xmx1000M de.folt.models.documentmodel.tbx.TbxDocument %1 %2

Quellcode:
----------
lib/openTMS_TM.jar enthlt den Quellcode.

Ausgabe:
--------

termEntry IDs added (531): 530
tig IDs added (1062): 1061
term IDs added (1062): 1061
Outputfile: out.tbx

Beispiel mit generatetbxids.bat:
--------------------------------
generatetbxids.bat c:\eclipse\workspace\openTMS\test\beo_de-DE-en-GB.sdltb_export.xml.TBX
oder
generatetbxids.bat c:\eclipse\workspace\openTMS\test\beo_de-DE-en-GB.sdltb_export.xml.TBX outfile.tbx

ID Erzeugung:
-------------

Es werden fr termEntry, tig, term fehlende IDs eingesetzt. Existierende IDs werden belassen.

termEntry_[Sequentielle Durchnummerierung der termEntry-ies]
tig_[Sequentielle Durchnummerierung der termEntry-ies]_[Sequentielle Durchnummerierung der tig-ies pro Langset]_[Totale sequentielle Durchnummerierung der tig-ies]_Sprache
term_[Sequentielle Durchnummerierung der termEntry-ies]_[Sequentielle Durchnummerierung der tig-ies pro Langset]_Sprache_[Sequentielle Durchnummerierung der term-ies pro tig]_[Totale sequentielle Durchnummerierung der term-ies]

Beispiel:

<termEntry id="termEntry_0001">
<tig id="tig_001_1_000002_en-GB">
<term id="term_001_1_de-DE_1_000001">


Aufruf des Termtaggers:
=======================

java -cp "..\..\..\lib\OpenTMS.jar;..\lib\external.jar;" -Xmx1000M de.folt.models.applicationmodel.termtagger.XliffTermTagger -xliffFile <xliff datei> -dataSource <tbx datei> -targetLanguage <ziel-sprache> -sourceLanguage <ausgangs-sprache> -debug <true|false> -stemmed <true|false> -fuzzyPercent <ganz-zahl> -lowercase <true|false> -maxWordLengthSearch <maximale wortanzahl fr fuzzy suche; -1 = alle verwenden>

Alternativ mit Liste von Dateien:

java -cp "..\..\..\lib\OpenTMS.jar;..\lib\external.jar;" -Xmx1000M de.folt.models.applicationmodel.termtagger.XliffTermTagger -xliffFileList <Datei mit Dateiliste> -dataSource <tbx datei> -targetLanguage <ziel-sprache> -sourceLanguage <ausgangs-sprache> -debug <true|false> -stemmed <true|false> -fuzzyPercent <ganz-zahl> -lowercase <true|false> -maxWordLengthSearch <maximale wortanzahl fr fuzzy suche; 0 = alle verwenden> -minFuzzyStringLength <minimale Lnge fr Fuzzyvergleich> -minFuzzyStartLength <minimale anzahl Buchatebn am Anfang identisch fr Fuzzyvergleich>


Wenn fuzzyPercent fehlt, keine Fuzzy-Suche
maxWordLengthSearch - Default ist 2

Beispielaufrufe:

call "c:\Program Files\Java\jre7\bin\java" -cp "..\..\..\lib\OpenTMS.jar;..\lib\external.jar;" -Xmx1000M de.folt.models.applicationmodel.termtagger.XliffTermTagger -xliffFile proofRead\draeger-de-fr_use_mind_1.txt.42001.ttx.sdlxliff -dataSource TermExport_421_de-DE-fr-FR.tbx -targetLanguage "fr-FR" -sourceLanguage "de-DE" -debug false -stemmed true -fuzzyPercent 70 -lowercase true -maxWordLengthSearch 2 -minFuzzyStringLength 5 -minFuzzyStartLength 1 > outtest-64bit-fuzzy-70.txt 2>&1 
ECHO ERRORLEVEL  %ERRORLEVEL%

call "c:\Program Files\Java\jre7\bin\java" -cp "..\..\..\lib\OpenTMS.jar;..\lib\external.jar;" -Xmx1000M de.folt.models.applicationmodel.termtagger.XliffTermTagger -xliffFileList files.txt -dataSource TermExport_421_de-DE-fr-FR.tbx -targetLanguage "fr-FR" -sourceLanguage "de-DE" -debug false -stemmed true -fuzzyPercent 70 -lowercase true > outtest.txt 2>&1 



