Forums Développement Multimédia

Aller au contenu

Grep : Capturer tout caractère non unicode ou unicode PUA

PAO InDesign Acrobat PDF

11 réponses à ce sujet

#1 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 16 November 2011 - 15:03 PM

Hello,

Je dois trouver des caractères NON unicode ou unicode PUA (private use area) dans un doc InDesign. J'ai bien vu ce post sur IDS : http://indesignsecre...ers-in-text.php mais l'idée de chercher tous les codes unicode de la planète à exclure m'effraie un peu.

En gros l'idée est de capturer des caractères non standards ou graphiques (genre windings). Je saiurai bien comment retrouver les caractères en windings mais j'aimerai mieux une approche agnostique dénué de tout paramètrage d'attributs.

Est-ce seulement possible ?

Merci d'avance,

Loic

#2 Eddy.vh

    Éternel apprenti.

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1194 messages

Posté 16 November 2011 - 20:00 PM

Salut Loic.
Tu peux filer un exemple, j'ai peur de ne pas avoir tout compris !

#3 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 16 November 2011 - 20:50 PM

Voir le messageedfred, le 16 November 2011 - 20:00 PM, dit :

Salut Loic.
Tu peux filer un exemple, j'ai peur de ne pas avoir tout compris !
Hello Eddy,
A vrai dire c'est flou pour moi aussi. Pour l'instant cela fait partie d'un cahier des charges et je cherche à valider les faisabilités. N'étant pas moi un pro de l'unicode et du GREP, je tentais ma chance :D

Loic

#4 Eddy.vh

    Éternel apprenti.

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1194 messages

Posté 16 November 2011 - 21:09 PM

Ben je pense que sur ce coup là, il faudra consulter Laurent ! :D Il devrait être à même de te dire si c'est au moins possible.
À bientôt.

#5 laurent.tournier

    Ceinture Bleue

  • Members
  • PipPipPipPipPip
  • 81 messages

Posté 16 November 2011 - 22:49 PM

Bonsoir Loïc,

Je ne vois pas trop ce que tu cherches, mais as-tu testé [\x{E000}-\x{F8FF}] ? Il s'agit des blocs PUA.

Modifié par Laurent Tournier, 16 November 2011 - 22:56 PM.


#6 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 16 November 2011 - 23:31 PM

Voir le messageLaurent Tournier, le 16 November 2011 - 22:49 PM, dit :

Bonsoir Loïc,

Je ne vois pas trop ce que tu cherches, mais as-tu testé [\x{E000}-\x{F8FF}] ? Il s'agit des blocs PUA.
Hello Laurent,

Encore une fois, c'est aussi flou pour vous que pour moi :D

Je pense que le client veut isoler des caractères de type symbole dont l'interpretation dans un PDF pourrait poser problème d'interpretation (caractère mal retranscrit ou absent), d'où la nécessité de trouver tout caractère non unicode ou dont le point de code se trouve en zone d'usage privé. Ton indication va déjà pouvoir me permettre de trouver ces caractères là. Il me reste à identifier les non unicode :S

merci encore,

Loic

#7 laurent.tournier

    Ceinture Bleue

  • Members
  • PipPipPipPipPip
  • 81 messages

Posté 16 November 2011 - 23:45 PM

Un non-Unicode ? Aurement dit un caractère ayant un codage qui ne correspondrait pas aux blocs Unicode ? A priori, tous les caractères devraient être Unicode. Quelle sont les polices utilisées ?

Modifié par Laurent Tournier, 16 November 2011 - 23:46 PM.


#8 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 16 November 2011 - 23:56 PM

Voir le messageLaurent Tournier, le 16 November 2011 - 23:45 PM, dit :

Un non-Unicode ? Aurement dit un caractère ayant un codage qui ne correspondrait pas aux blocs Unicode ? A priori, tous les caractères devraient être Unicode. Quelle sont les polices utilisées ?


Hello,
Dès que j'en sais plus, je reviens par ici :D
merci de ton intérêt en tout cas :)

Loic

#9 Mandrake

    (`·.¸ . . :✩: . . ¸.·´)

  • Community Manager
  • PipPipPipPipPipPipPipPip
  • 1374 messages

Posté 17 November 2011 - 07:27 AM

Citation

l'interpretation dans un PDF pourrait poser problème d'interpretation (caractère mal retranscrit ou absent),
Pour éviter d'éventuels problèmes de flashage/impression donc ?

Le plus "simple" ne serait-il pas dans ce cas de lui proposer une sectorisation à la volée ?
(C'est pas top mais à priori imparable)

#10 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 17 November 2011 - 09:05 AM

Voir le messageMandrake, le 17 November 2011 - 07:27 AM, dit :

Pour éviter d'éventuels problèmes de flashage/impression donc ?

Le plus "simple" ne serait-il pas dans ce cas de lui proposer une sectorisation à la volée ?
(C'est pas top mais à priori imparable)
Hello,

A priori c'est plutôt destiné à l'accessibilité. Je pense que mon client redoute que le "lecteur" de texte ne puisse pas interpréter certains symboles. Il me demande donc de les cibler pour intervention avant export PDF.

Loic

#11 Mandrake

    (`·.¸ . . :✩: . . ¸.·´)

  • Community Manager
  • PipPipPipPipPipPipPipPip
  • 1374 messages

Posté 17 November 2011 - 09:14 AM

Citation

A priori c'est plutôt destiné à l'accessibilité. Je pense que mon client redoute que le "lecteur" de texte ne puisse pas interpréter certains symboles
Ok mais dans ce cas tu as des caractères UNICODE dans la plupart des langues y compris non européennes non ?

#12 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 17 November 2011 - 09:56 AM

Voir le messageMandrake, le 17 November 2011 - 09:14 AM, dit :

Ok mais dans ce cas tu as des caractères UNICODE dans la plupart des langues y compris non européennes non ?
c'est ce que semble indiquer Laurent. J'avoue ne pas être très au fait de ces questions. Je vais essayer d'éclaircir les attentes de mon client :D

Merci à vous tous pour votre souci.

Loic



1 utilisateur(s) li(sen)t ce sujet

0 membre(s), 1 invité(s), 0 utilisateur(s) anonyme(s)