We apologize for untranslated text, you can use the Google Translation button to get an automatic translation of the web page in the language of your choice.

Probléme d'indexation des fichiers ppt

Philippe Lemoine · on 10/16/12 at 3:29 PM

Bonjour,

Nous utilisons JCMS pour notre Intranet documentaire d'entreprise.

J'ai constaté que le traitement d'indexation des fichiers ignore systématiquement les documents powerpoint (extension ppt).

Dans le fichier jcms.log , nous trouvons l'exception suivante :

2012-10-16 17:09:21,004 WARN [ProcessingThread-0] [Intranet Mutuelle MCD] [processingmanagement.ProcessingThread] - Exception during file processing 'PowerPoint parser' for 'C:\intranet-data\webapps\mcd\upload\docs\application\vnd.ms-powerpoint\2012-04\presentationchallenges_et_moyens_2012.ppt_ java.lang.NoSuchMethodError: org.apache.poi.poifs.filesystem.POIFSFileSystem.getRoot()Lorg/apache/poi/poifs/filesystem/DirectoryNode; at org.apache.poi.hslf.extractor.QuickButCruddyTextExtractor.<init>(QuickButCruddyTextExtractor.java:105) at org.apache.poi.hslf.extractor.QuickButCruddyTextExtractor.<init>(QuickButCruddyTextExtractor.java:93) at com.jalios.jcmsplugin.documentindexer.processor.MSPowerPointParser.extractText(MSPowerPointParser.java:31) at com.jalios.jcms.fileprocessor.processingmanagement.ProcessingThread.parse(ProcessingThread.java:720) at com.jalios.jcms.fileprocessor.processingmanagement.ProcessingThread.runComponent(ProcessingThread.java:557) at com.jalios.jcms.fileprocessor.processingmanagement.ProcessingThread.runComponents(ProcessingThread.java:472) at com.jalios.jcms.fileprocessor.processingmanagement.ProcessingThread.processFile(ProcessingThread.java:376) at com.jalios.jcms.fileprocessor.processingmanagement.ProcessingThread.performProccessings(ProcessingThread.java:300) at com.jalios.jcms.fileprocessor.processingmanagement.ProcessingThread.run(ProcessingThread.java:105)

Est-ce que quelqu'un a déjà eu cette erreur ?

La configuration de notre environnement est la suivante :

  • JCMS 7.0.2 (build-20111007130612) add-pack AddPack_profideo
  • Apache Tomcat/6.0.29
  • JRE6 - Java HotSpot(TM) 64-Bit Server VM (20.5-b03)
  • Windows Server 2008 R2 6.1 (amd64)
  • Module Indexation des documents V4.0

Cordialement, Philippe LEMOINE

4 pts
Frédéric Touitou · on 10/17/12 at 3:54 PM

Bonjour,

Apparemment, vous utilisez le mécanisme de conversion des fichiers bureautiques (destiné à extraire les contenus textuels de ces derniers) intégré à JCMS, qui est relativement léger, et ne gère pas certains documents.
Le Module de conversion PDF permet justement de traiter un plus grand nombre de cas, que ce soit certaines extensions de fichiers, ou des fonctionnalités "complexes" des formats les plus courants.
Je vous conseille donc d'étudier la possibilité d'utiliser ce dernier module.

Bien cordialement,
Frédéric Touitou

0 pts