We apologize for untranslated text, you can use the Google Translation button to get an automatic translation of the web page in the language of your choice.

Module de conversion PDF et tableurs Excel

Cyril DAVID · on 12/16/13 at 2:05 PM

Bonjour,

Suite à la mise en place du module de conversion PDF, nous constatons que les fichiers Excel ne sont pas convertis.

En regardant dans la liste des processeurs existant (menu "Traitements des fichiers" de l'espace d'administration centrale), il semblerait justement, que les fichiers xls et xlsx ne sont pas gérés par ce module.

Chose qui me surprend, car ces deux extensions sont spécifiées dans la description du module.

Merci d'avance pour votre support,

4 pts
Ronan Kerdudou · on 12/16/13 at 2:41 PM

Dans le module de conversion pdf 5.1 ces fichiers sont bien traités par défaut.

Vérifiez si vous n'avez pas surchargé les propriétés suivantes dans votre plugin site ou dans custom.prop :

  • fileprocessor.repository.JCMSUpload.component.PdfConverter.extensions
  • fileprocessor.repository.JCMSUpload.component.GeneratedPdfParser.extensions

 

Il est assez courant de désactiver ces types car le rendu est rarement intéressant à moins que les utilisateurs ne définissent proprement la zone d'impression.

#2

Ces 2 propriétés sont renseignées dans le "plugin.prop" du module de conversion pdf, le premier indique les extensions de fichier qui doivent passer dans le PdfConverter, le second ceux pour lesquels on va indexer le contenu à partir du fichier pdf généré (GeneratedPdfParser).

Ronan Kerdudou · on 12/16/13 at 4:24 PM
#3

Merci pour votre réponse.

Ci-dessous quelques questions que je me pose concernant l'indexation :

  • L'indexation d'un document n'est réalisé que par le GeneratedPdfParser ?
  • N'existe-t-il pas des parsers pour les documents Word, etc. ?

A l'heure actuelle, je n'ai pas l'impression que le GeneratedPdfParser indexe réellement les fichiers PDF, car lors d'une recherche d'un terme, présent dans un document, ce document n'est jamais remonté.

Cyril DAVID · on 12/16/13 at 4:53 PM
#4

Si vous avez aussi le module d'indexation des documents alors ils peuvent être indexés sans être converti en pdf, si vos recherches sont infructueuses vérifiez dans les logs de JCMS et dans les écrans d'administration "Gestion des index de recherche" et "Traitements des fichiers"... Vous pouvez aussi inspecter l'index avec des outils comme "Luke".

Ronan Kerdudou · on 12/16/13 at 5:00 PM
1 pt