Je souhaite utiliser pdftron et tout fonctionne parfaitement, mais lorsque je copie du texte à partir d'un pdf, certains caractères se transforment en carré vide et point d'interrogation, une idée?

ici est mon pdf.

Comme vous pouvez le voir ci-dessous: entrez la description de l'image ici

J'ai écrit ce code:

WebViewer({
    path: '/assets/plugins/pdftron',
    initialDoc: '/practical.pdf',
    fullAPI: true,
    disableLogs: true
}, document.getElementById('pdf')).then((instance) => {
    // PDFNet is only available with full API enabled
    const { PDFNet, docViewer } = instance;

    let Feature = instance.Feature;
    instance.disableFeatures([Feature.NotesPanel]);

    docViewer.on('documentLoaded', () => {
        // call methods relating to the loaded document
    });


    instance.textPopup.add({
        type: 'actionButton',
        img: '/language.svg',
        onClick: () => {
            const quads = docViewer.getSelectedTextQuads(docViewer.getCurrentPage());
            const text = docViewer.getSelectedText();
            $("#out-pdf").html(text);
            console.log(quads);
        },
    });
});
1
Abolfazl Mohajeri 27 févr. 2021 à 12:27

2 réponses

Meilleure réponse

Le document semble provoquer une extraction incorrecte. L'extraction n'est pas définie par la spécification PDF, de sorte que chaque visionneur gère les cas de manière peu différente. Dans votre cas, il y a probablement une police mal formée ou incomplète ou une carte Unicode incluse dans le document. Nous avons ajouté plusieurs correctifs à nos composants de base et avec ces correctifs, l'extraction se déroule correctement. Malheureusement, la version actuelle de WebViewer n'inclut pas encore ces correctifs. Nous ne pouvons pas indiquer le calendrier exact de l'arrivée des correctifs sur le WebViewer, mais cela devrait au moins faire partie de notre prochaine version majeure. Pour l'instant, j'essaierais de voir si vous pouvez recréer le document et voir si cela aide. La plupart des documents que nous voyons et testons n'ont aucun problème d'extraction.

2
Jussi Nieminen 11 mars 2021 à 23:48