fix bug xdxf wrong format
[mdictionary] / trunk / src / plugins / xdxf / src / xdxfplugin.cpp
1 /*******************************************************************************
2
3     This file is part of mDictionary.
4
5     mDictionary is free software: you can redistribute it and/or modify
6     it under the terms of the GNU General Public License as published by
7     the Free Software Foundation, either version 3 of the License, or
8     (at your option) any later version.
9
10     mDictionary is distributed in the hope that it will be useful,
11     but WITHOUT ANY WARRANTY; without even the implied warranty of
12     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13     GNU General Public License for more details.
14
15     You should have received a copy of the GNU General Public License
16     along with mDictionary.  If not, see <http://www.gnu.org/licenses/>.
17
18     Copyright 2010 Comarch S.A.
19
20 *******************************************************************************/
21
22 /*! \file xdxfplugin.cpp
23 \author Jakub Jaszczynski <j.j.jaszczynski@gmail.com>
24 */
25
26 #include "xdxfplugin.h"
27 #include <QDebug>
28 #include "../../../includes/Notify.h"
29
30 XdxfPlugin::XdxfPlugin(QObject *parent) : CommonDictInterface(parent),
31                     _langFrom(""), _langTo(""),_name(""), _infoNote("") {
32     _settings = new Settings();
33     _dictDialog = new XdxfDictDialog(this);
34     cachingDialog = new XdxfCachingDialog(this);
35
36     _settings->setValue("type","xdxf");
37     _icon = QIcon(":/icons/xdxf.png");
38     _wordsCount = -1;
39     stopped = false;
40
41     connect(cachingDialog, SIGNAL(cancelCaching()),
42             this, SLOT(stop()));
43     connect(this, SIGNAL(updateCachingProgress(int,int)),
44             cachingDialog, SLOT(updateCachingProgress(int,int)));
45     initAccents();
46 }
47
48
49 XdxfPlugin::~XdxfPlugin() {
50     delete _settings;
51     delete cachingDialog;
52     delete _dictDialog;
53 }
54
55
56 QString XdxfPlugin::langFrom() const {   
57     return _langFrom;
58 }
59
60
61 QString XdxfPlugin::langTo() const {
62     return  _langTo;
63 }
64
65
66 QString XdxfPlugin::name() const {
67     return  _name;
68 }
69
70
71 QString XdxfPlugin::type() const {
72     return QString("xdxf");
73 }
74
75
76 QString XdxfPlugin::infoNote() const {
77     return  _infoNote;
78 }
79
80
81 QList<Translation*> XdxfPlugin::searchWordList(QString word, int limit) {
82     if( word.indexOf("*")==-1 && word.indexOf("?")==-1 &&
83         word.indexOf("_")==-1 && word.indexOf("%")==-1)
84         word+="*";
85
86     if(isCached())
87         return searchWordListCache(word,limit);
88     return searchWordListFile(word, limit);
89 }
90
91
92 QList<Translation*> XdxfPlugin::searchWordListCache(QString word, int limit) {
93     int i=0;
94     QSet<Translation*> translations;
95     QString cacheFilePath = _settings->value("cache_path");
96
97     db.setDatabaseName(cacheFilePath);
98     if(!QFile::exists(cacheFilePath) || !db.open()) {
99         qDebug() << "Database error" << db.lastError().text() << endl;
100         Q_EMIT notify(Notify::Warning, QString(tr("Cache database cannot be "
101                 "opened for %1 dictionary. Searching in XDXF file. "
102                 "You may want to recache.").arg(name())));
103         _settings->setValue("cached","false");
104         return searchWordListFile(word, limit);
105     }
106     stopped = false;
107     word = word.toLower();
108     word = word.replace("*", "%");
109     word = word.replace("?", "_");
110
111     QSqlQuery cur(db);
112     if(limit !=0)
113         cur.prepare("select word from dict where word like ? or normalized "
114                     "like ? limit ?");
115     else
116         cur.prepare("select word from dict where word like ? or normalized "
117                     "like ?");
118     cur.addBindValue(word);
119     cur.addBindValue(word);
120     if(limit !=0)
121         cur.addBindValue(limit);
122     cur.exec();
123
124     bool in = false;
125     while(cur.next() && (i<limit || limit==0 ) ) {
126         in = true;
127         bool ok=true;
128         Translation *tran;
129         foreach(tran,translations) {
130             if(tran->key().toLower()==cur.value(0).toString().toLower())
131                     ok=false;
132         }
133         if(ok) {  /*add key word to list*/
134             translations.insert(new TranslationXdxf(
135                     cur.value(0).toString().toLower(),
136                     _infoNote, this));
137             i++;
138         }
139     }
140     db.close();
141     return translations.toList();
142 }
143
144
145 QList<Translation*> XdxfPlugin::searchWordListFile(QString word, int limit) {
146     QSet<Translation*> translations;
147     QFile dictionaryFile(_settings->value("path"));
148     word = word.toLower();
149     stopped = false;
150
151     QRegExp regWord(word);
152     regWord.setCaseSensitivity(Qt::CaseInsensitive);
153     regWord.setPatternSyntax(QRegExp::Wildcard);
154
155     /*check xdxf file exist*/
156     if(!QFile::exists(_settings->value("path"))
157                 || !dictionaryFile.open(QFile::ReadOnly | QFile::Text)) {
158         qDebug()<<"Error: could not open file";
159         Q_EMIT notify(Notify::Warning,
160                 QString(tr("XDXF file cannot be read for %1").arg(name())));
161         return translations.toList();
162     }
163
164     QXmlStreamReader reader(&dictionaryFile);
165     QString readKey;
166     int i=0;
167
168     /*search words list*/
169     while(!reader.atEnd() && !stopped){
170         reader.readNextStartElement();
171         if(reader.name()=="ar") {
172             while(reader.name()!="k" && !reader.atEnd())
173                 reader.readNextStartElement();
174             if(!reader.atEnd())
175                 readKey = reader.readElementText();
176             if((regWord.exactMatch(readKey)
177                     || regWord.exactMatch(removeAccents(readKey)))
178                     && (i<limit || limit==0)) {
179                 bool ok=true;
180                 Translation *tran;
181                 foreach(tran,translations) {
182                     if(tran->key().toLower()==readKey.toLower())
183                         ok=false; /*if key is in the dictionary more that one */
184                 }
185                 if(ok) {  /*add key word to list*/
186                     translations<<(new TranslationXdxf(readKey.toLower(),
187                                     _infoNote,this));
188                     i++;
189                 }
190                 if(i>=limit && limit!=0)
191                     break;
192             }
193         }
194         this->thread()->yieldCurrentThread();
195     }
196     stopped=false;
197     dictionaryFile.close();
198     return translations.toList();
199 }
200
201
202 QString XdxfPlugin::search(QString key) {
203     if(isCached())
204         return searchCache(key);
205     return searchFile(key);
206 }
207
208
209 QString XdxfPlugin::searchCache(QString key) {
210     QString result("");
211     QString cacheFilePath = _settings->value("cache_path");
212     db.setDatabaseName(cacheFilePath);
213     key = key.toLower();
214
215     if(!QFile::exists(cacheFilePath) || !db.open()) {
216         qDebug() << "Database error" << db.lastError().text() << endl;
217         Q_EMIT notify(Notify::Warning, QString(tr("Cache database cannot be "
218                 "opened for %1 dictionary. Searching in XDXF file. "
219                 "You may want to recache.").arg(name())));
220         _settings->setValue("cached","false");
221         return searchFile(key);
222     }
223
224     QSqlQuery cur(db);
225
226     cur.prepare("select translation from dict where word like ?");
227     cur.addBindValue(key);
228     cur.exec();
229     while(cur.next())
230         result += cur.value(0).toString();
231
232     db.close();
233
234     return result;
235
236 }
237
238
239 QString XdxfPlugin::searchFile(QString key) {
240     QFile dictionaryFile(_settings->value("path"));
241     QString resultString("");
242     key = key.toLower();
243
244     /*check xdxf file exist*/
245     if(!QFile::exists(_settings->value("path"))
246                 || !dictionaryFile.open(QFile::ReadOnly | QFile::Text)) {
247         Q_EMIT notify(Notify::Warning,
248                 QString(tr("XDXF file cannot be read for %1").arg(name())));
249         qDebug()<<"Error: could not open file";
250         return "";
251     }
252
253     QXmlStreamReader reader(&dictionaryFile);
254     QString readKey;
255     bool match =false;
256     stopped = false;
257
258     /*search translations for word*/
259     while (!reader.atEnd()&& !stopped) {
260         reader.readNext();
261         if(reader.tokenType() == QXmlStreamReader::StartElement) {
262             if(reader.name()=="k") {
263                 readKey = reader.readElementText();
264                 if(readKey.toLower()==key.toLower())
265                     match = true;
266             }
267         }
268         if(match) {
269             QString temp("");
270             while(reader.name()!="ar" && !reader.atEnd()) {
271                 if(reader.name()!="" && reader.name()!="k") {
272                     if(reader.tokenType()==QXmlStreamReader::EndElement)
273                         temp+="</";
274                     if(reader.tokenType()==QXmlStreamReader::StartElement)
275                         temp+="<";
276                     temp+=reader.name().toString();
277                     if(reader.name().toString()=="c" &&
278                             reader.tokenType()==QXmlStreamReader::StartElement)
279                        temp= temp + " c=\"" + reader.attributes().
280                                value("c").toString() + "\"";
281                     temp+=">";
282                 }
283                 temp+= reader.text().toString().replace("<","&lt;").
284                         replace(">","&gt;");
285                 reader.readNext();
286             }
287             if(temp.at(0)==QChar('\n'))
288                 temp.remove(0,1);
289             resultString+="<key>" + readKey +"</key>";
290             resultString+="<t>" + temp + "</t>";
291             match=false;
292         }
293         this->thread()->yieldCurrentThread();
294     }
295     stopped=false;
296     dictionaryFile.close();
297     return resultString;
298 }
299
300
301 void XdxfPlugin::stop() {
302     stopped=true;
303 }
304
305
306 DictDialog* XdxfPlugin::dictDialog() {
307      return _dictDialog;
308 }
309
310
311 CommonDictInterface* XdxfPlugin::getNew(const Settings *settings) const {
312     XdxfPlugin *plugin = new XdxfPlugin();
313     if(settings && plugin->setSettings(settings))
314         return plugin;
315     else {
316         delete plugin;
317         return new XdxfPlugin();
318     }
319 }
320
321
322 bool XdxfPlugin::isAvailable() const {
323     return true;
324 }
325
326
327 void XdxfPlugin::setHash(uint _hash) {
328     this->_hash=_hash;
329 }
330
331
332 uint XdxfPlugin::hash() const {
333    return _hash;
334 }
335
336
337 Settings* XdxfPlugin::settings() {
338 /*
339     Settings *returnSettings=new Settings;
340     QStringList list = _settings->keys();
341     foreach(QString key, list)
342             returnSettings->setValue(key,_settings->value(key));
343     return returnSettings;
344 */
345     return _settings;
346 }
347
348
349 bool XdxfPlugin::isCached() {
350     if(_settings->value("cached") == "true")
351         return true;
352     return false;
353 }
354
355
356 bool XdxfPlugin::setSettings(const Settings *settings) {
357     if(settings) {
358         bool isPathChange=false;
359         QString oldPath = _settings->value("path");
360         if(oldPath != settings->value("path")) {
361             if(oldPath!="" && _settings->value("cache_path")!="")
362                 clean();
363             isPathChange=true;
364         }
365
366         foreach(QString key, settings->keys()) {
367            if(key != "generateCache")
368                _settings->setValue(key, settings->value(key));
369         }
370
371         if(!getDictionaryInfo()) {
372             Q_EMIT notify(Notify::Warning,
373                 QString(tr("XDXF file is in wrong format")));
374             qDebug()<<"Error: xdxf file is in wrong format";
375             return false;
376         }
377
378         if(isPathChange) {
379             _wordsCount=0;
380             if(oldPath!="")
381                 _settings->setValue("cached","false");
382             if(_settings->value("cached")=="true"
383                     && _settings->value("cache_path")!="") {
384                 db_name = _settings->value("type")
385                         + _settings->value("cache_path");
386                 db = QSqlDatabase::addDatabase("QSQLITE",db_name);
387             }
388         }
389
390         if((_settings->value("cached") == "false" ||
391             _settings->value("cached").isEmpty()) &&
392             settings->value("generateCache") == "true") {
393             clean();
394             makeCache("");
395         }
396
397         else if (settings->value("generateCache") == "false") {
398             _settings->setValue("cached", "false");
399         }
400     }
401     else
402         return false;
403     Q_EMIT settingsChanged();
404     return true;
405 }
406
407
408 bool XdxfPlugin::getDictionaryInfo() {
409     QFile dictionaryFile(_settings->value("path"));
410     if(!QFile::exists(_settings->value("path"))
411                 || !dictionaryFile.open(QFile::ReadOnly | QFile::Text)) {
412        Q_EMIT notify(Notify::Warning,
413                QString(tr("XDXF dictionary cannot be read from file")));
414         qDebug()<<"Error: could not open file";
415         return false;
416     }
417
418     bool okFormat=false;
419     QXmlStreamReader reader(&dictionaryFile);
420     reader.readNextStartElement();
421     if(reader.name()=="xdxf") {
422         okFormat=true;
423         if(reader.attributes().hasAttribute("lang_from"))
424             _langFrom = reader.attributes().value("lang_from").toString();
425         if(reader.attributes().hasAttribute("lang_to"))
426             _langTo = reader.attributes().value("lang_to").toString();
427     }
428     reader.readNextStartElement();
429     if(reader.name()=="full_name")
430         _name=reader.readElementText();
431     reader.readNextStartElement();
432     if(reader.name()=="description")
433         _infoNote=reader.readElementText();
434
435     QString format = "png";
436     QString initialPath = QDir::currentPath() + "/xdxf." + format;
437
438     _infoNote="path=\""+initialPath+"\"> \n" + _name + " [" + _langFrom + "-"
439                 + _langTo + "] ( xdxf )";
440     dictionaryFile.close();
441     if(okFormat)
442         return true;
443     return false;
444 }
445
446
447 QIcon* XdxfPlugin::icon() {
448     return &_icon;
449 }
450
451
452 int XdxfPlugin::countWords() {
453     if(_wordsCount>0)
454         return _wordsCount;
455     QFile dictionaryFile(_settings->value("path"));
456     if(!QFile::exists(_settings->value("path"))
457                 || !dictionaryFile.open(QFile::ReadOnly | QFile::Text)) {
458         Q_EMIT notify(Notify::Warning,
459                 QString(tr("XDXF file cannot be read for %1 dictionary")
460                 .arg(name())));
461         qDebug()<<"Error: could not open file";
462         return -1;
463     }
464
465     dictionaryFile.seek(0);
466
467     long wordsCount = 0;
468
469     QString line;
470     while(!dictionaryFile.atEnd()) {
471         line = dictionaryFile.readLine();
472         if(line.contains("<k>")) {
473             wordsCount++;
474         }
475     }
476     _wordsCount = wordsCount;
477     dictionaryFile.close();
478     return wordsCount;
479 }
480
481
482 bool XdxfPlugin::makeCache(QString) {
483     cachingDialog->setVisible(true);
484     QCoreApplication::processEvents();
485     QFileInfo dictFileN(_settings->value("path"));
486     QString cachePathN;
487     stopped = false;
488
489     /*create cache file name*/
490     int i=0;
491     do {
492         cachePathN = QDir::homePath() + "/.mdictionary/"
493                                       + dictFileN.completeBaseName()+"."
494                                       +QString::number(i) + ".cache";
495         i++;
496     } while(QFile::exists(cachePathN));
497
498     db_name = _settings->value("type") + cachePathN;
499     db = QSqlDatabase::addDatabase("QSQLITE",db_name);
500
501     qDebug()<<QSqlDatabase::connectionNames().size();
502     foreach(QString name,QSqlDatabase::connectionNames())
503         qDebug()<<name;
504     /*checke errors (File open and db open)*/
505     QFile dictionaryFile(dictFileN.filePath());
506     if (!QFile::exists(_settings->value("path"))
507                 || !dictionaryFile.open(QFile::ReadOnly | QFile::Text)) {
508         Q_EMIT updateCachingProgress(100, 0);
509         Q_EMIT notify(Notify::Warning,
510                 QString(tr("XDXF file cannot be read for %1 dictionary")
511                 .arg(name())));
512         return 0;
513     }
514     QXmlStreamReader reader(&dictionaryFile);
515     db.setDatabaseName(cachePathN);
516     if(!db.open()) {
517         qDebug() << "Database error" << db.lastError().text() << endl;
518         Q_EMIT updateCachingProgress(100, 0);
519         Q_EMIT notify(Notify::Warning, QString(tr("Cache database cannot be "
520                 "opened for %1 dictionary. Searching in XDXF file. "
521                 "You may want to recache.").arg(name())));
522         return false;
523     }
524
525     /*inicial sqlQuery*/
526     QCoreApplication::processEvents();
527     QSqlQuery cur(db);
528     cur.exec("PRAGMA synchronous = 0");
529     cur.exec("drop table dict");
530     QCoreApplication::processEvents();
531     cur.exec("create table dict(word text, normalized text ,translation text)");
532     int counter = 0;
533     cur.exec("BEGIN;");
534
535     QString readKey;
536     bool match = false;
537     QTime timer;
538     timer.start();
539     countWords();
540     int lastProg = -1;
541     _settings->setValue("strip_accents", "true");
542     counter=0;
543
544     /*add all words to db*/
545     while (!reader.atEnd() && !stopped) {
546         QCoreApplication::processEvents();
547         reader.readNext();
548         if(reader.tokenType() == QXmlStreamReader::StartElement) {
549             if(reader.name()=="k"){
550                 readKey = reader.readElementText();
551                 match = true;
552             }
553         }
554         if(match) {
555             QString temp("");
556             while(reader.name()!="ar" && !reader.atEnd()) {
557                 if(reader.name()!="" && reader.name()!="k") {
558                     if(reader.tokenType()==QXmlStreamReader::EndElement)
559                         temp+="</";
560                     if(reader.tokenType()==QXmlStreamReader::StartElement)
561                         temp+="<";
562                     temp+=reader.name().toString();
563                     if(reader.name().toString()=="c"
564                         && reader.tokenType()==QXmlStreamReader::StartElement) {
565                         temp= temp + " c=\""
566                                    + reader.attributes().value("c").toString()
567                                    + "\"";
568                     }
569                     temp+=">";
570                 }
571                 temp+= reader.text().toString().replace("<","&lt;").replace(">"
572                               ,"&gt;");
573                 reader.readNext();
574             }
575             if(temp.at(0)==QChar('\n'))
576                 temp.remove(0,1);
577             temp="<key>" + readKey + "</key>" + "<t>" + temp+ "</t>";
578             match=false;
579             cur.prepare("insert into dict values(?,?,?)");
580             cur.addBindValue(readKey);
581             cur.addBindValue(removeAccents(readKey));
582             cur.addBindValue(temp);
583             cur.exec();
584             counter++;
585             int prog = counter*100/_wordsCount;
586             if(prog % 5 == 0 && lastProg != prog) {
587                 Q_EMIT updateCachingProgress(prog,timer.restart());
588                 lastProg = prog;
589             }
590         }
591     }
592     cur.exec("END;");
593     cur.exec("select count(*) from dict");
594     cachingDialog->setVisible(false);
595
596     /*checke errors (wrong number of added words)*/
597     countWords();
598     if(!cur.next() || countWords() != cur.value(0).toInt()) {
599         Q_EMIT updateCachingProgress(100, timer.restart());
600         Q_EMIT notify(Notify::Warning,
601                 QString(tr("Database caching error, please try againg.")));
602         db.close();
603         return false;
604     }
605
606     _settings->setValue("cache_path", cachePathN);
607     _settings->setValue("cached", "true");
608
609     db.close();
610     return true;
611 }
612
613
614 void XdxfPlugin::clean() {
615     if(QFile::exists(_settings->value("cache_path"))) {
616         QFile(_settings->value("cache_path")).remove();
617         QSqlDatabase::removeDatabase(db_name);
618     }
619 }
620
621
622 Q_EXPORT_PLUGIN2(xdxf, XdxfPlugin)