Forums Développement Multimédia

Aller au contenu

Grep

PAO InDesign Acrobat PDF

17 réponses à ce sujet

#1 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 24 June 2011 - 09:23 AM

Hello,

J'essaye de capturer le mot company quelque soit sa casse à l'exception des cas suivants :
www.company.com et xxx@company.com

J'arrive a capturer company dans a peu près tous les contextes mais pour les mails/adresses web c'est soit l'un soit l'autre, je n'arrive pas à les exclure ensemble. Une idée ?

(?i)(?<!@)company(?!.com)

j'ai testé (sans succès)
(?i)(?<!@|www.)company(?!.com)
(?i)(?<!@)|(?<!www.)company(?!.com)
(?i)(?<!@)company(?!.com)|(?<!www.)company(?!.com)
et pleins d'autres encore

Merci d'avance,

Loic

#2 Kosic

  • Guests

Posté 24 June 2011 - 09:50 AM

Voir le messageLoic_Aigon, le 24 June 2011 - 09:23 AM, dit :

Hello,

J'essaye de capturer le mot company quelque soit sa casse à l'exception des cas suivants :
www.company.com et xxx@company.com

J'arrive a capturer company dans a peu près tous les contextes mais pour les mails/adresses web c'est soit l'un soit l'autre, je n'arrive pas à les exclure ensemble. Une idée ?

(?i)(?<!@)company(?!.com)

j'ai testé (sans succès)
(?i)(?<!@|www.)company(?!.com)
(?i)(?<!@)|(?<!www.)company(?!.com)
(?i)(?<!@)company(?!.com)|(?<!www.)company(?!.com)
et pleins d'autres encore

Merci d'avance,

Loic

Question d'un total ignorant :
Sachant que dans ces deux cas il n'y a pas d'espace, la notion de "mot entier" ne peut-elle s'appliquer ?

#3 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 24 June 2011 - 10:05 AM

Voir le messageKosic, le 24 June 2011 - 09:50 AM, dit :

Question d'un total ignorant :
Sachant que dans ces deux cas il n'y a pas d'espace, la notion de "mot entier" ne peut-elle s'appliquer ?
Pas sur de te suivre ? :smile:
Sinon j'ai simplifié mais la chaine a capturer peut aussi bien etre company que company ltd
ce que je capture par company( ltd)?
Loic

#4 JRB

    abracadabrantesque

  • Members
  • PipPipPipPipPipPipPipPip
  • 1864 messages

Posté 24 June 2011 - 10:18 AM

Je n'ai pas de réponse GREP mais une astuce de contournement :


- utiliser GREP pour appliquer un style de caractère particulier aux emails et aux URL
- ensuite, utiliser GREP comme indiqué dans le 1er message en s'arrangeant pour ne pas rechercher dans le style de caractère appliqué aux emails et URL.

Image IPB
Acrobate du PDF, InDesigner et Photoshopographe
abracadabraPDF.net

#5 Kosic

  • Guests

Posté 24 June 2011 - 10:54 AM

Voir le messageLoic_Aigon, le 24 June 2011 - 10:05 AM, dit :

Pas sur de te suivre ? :smile:

Moi non plus. Image IPB
Ce que je me disais c'est qu'un mot est toujours précédé ou suivi d'une espace dans une phrase, alors que pour une adresse web ce ne sera pas le cas.

#6 Eddy.vh

    Éternel apprenti.

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1194 messages

Posté 24 June 2011 - 13:40 PM

Bonjour tout le monde.
Loic, ne serait-il pas plus facile de chercher l'inverse ? C-à-d Company ou company seulement s'il est en début de paragraphe (au cas où) ou précédé d'une espace.
Cela exclut toutes les formes ou Company est accolé à n'importe quoi d'autre !

J'ai tenté ceci mais je ne connais pas ton contexte à 100 % !!!

((?<=\s)|(?<=^))(?i)Company fonctionne pas à 100%. La regex ci-dessous fonctionne !


EDIT :
La regex suivante peut aussi fonctionner : Retrouver company (peu importe la casse) s'il n'est pas suivi d'un point + un caractère quelconque. Cela exclut les adresses mail et web mais pas le mot s'il est suivi d'un point en fin de paragraphe par exemple.

(?i)Company(?![.].)

#7 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 24 June 2011 - 16:07 PM

Hello Eddy,

Merci pour ta requête mais elle semble pas assez puissante.
Soit la phrase : company, company ltd, www.company.com, info@company.com
elle ne trouve que le premier company :S

Loic

#8 jmlevy

  • Guests

Posté 24 June 2011 - 16:54 PM

Ou j'en ai raté un bout, mais il me semble que ça fonctionne avec ça :
(?i)company(?!\.com)

#9 Eddy.vh

    Éternel apprenti.

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1194 messages

Posté 24 June 2011 - 18:32 PM

Voir le messageLoic_Aigon, le 24 June 2011 - 16:07 PM, dit :

Hello Eddy,

Merci pour ta requête mais elle semble pas assez puissante.
Soit la phrase : company, company ltd, www.company.com, info@company.com
elle ne trouve que le premier company :S

Loic

Je viens pourtant de tester ma deuxième regex sut ta phrase et elle fonctionne.
Il faut faire attention si tu copies / colles la régex, une espace s'ajoute à la fin dans le R/R grep, il faut la supprimer sous peine de non fonctionnement.

@Jean-Marc. J'ai bien pensé à ta regex mais elle ne s'applique pas sur un .org, .eu, .fr. Une fois de plus j'ai de mon côté cherché à standardiser. Si il n'y a que du .com alors c'est bien sur parfait

#10 laurent.tournier

    Ceinture Bleue

  • Members
  • PipPipPipPipPip
  • 81 messages

Posté 24 June 2011 - 22:46 PM

Bonsoir,
J'allais proposer une solution (incomplète), mais celle d'edfred fonctionne parfaitement.

Modifié par Laurent Tournier, 24 June 2011 - 22:51 PM.


#11 laurent.tournier

    Ceinture Bleue

  • Members
  • PipPipPipPipPip
  • 81 messages

Posté 24 June 2011 - 23:18 PM

Voir le messageLaurent Tournier, le 24 June 2011 - 22:46 PM, dit :

Bonsoir,
J'allais proposer une solution (incomplète), mais celle d'edfred fonctionne parfaitement.

Après quelques essais, je propose une nouvelle solution qui reprend celle d'edfred et la complète (cf. partie du bas). La solution d'edfred prend bien "company" en fin d'article mais ignore "company" suivi d'un point dans le cas d'un point final d'une phrase. En ajoutant \S à sa regex, tous les cas semblent pris en compte. A vérifier, bien sûr.
Image attachée: company.jpg

#12 Eddy.vh

    Éternel apprenti.

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1194 messages

Posté 25 June 2011 - 08:20 AM

Bonjour à tous.
En effet, j'ai pas pensé au fins de phrases mais seulement en fin de paragraphe ou de sauts de lignes. Merci Laurent pour le complément.

PS Laurent. est-ce que [.] = \. ? Je veux dire l'antislash permet d'échapper le point ?

#13 laurent.tournier

    Ceinture Bleue

  • Members
  • PipPipPipPipPip
  • 81 messages

Posté 25 June 2011 - 08:58 AM

Voir le messageedfred, le 25 June 2011 - 08:20 AM, dit :

PS Laurent. est-ce que [.] = \. ? Je veux dire l'antislash permet d'échapper le point ?

Bonjour,
Oui, l'antislash permet d'échapper le point, comme tous les autres caractères spéciaux s'ils ne sont pas insérés dans un jeu de caractères.
Bon week end

#14 Eddy.vh

    Éternel apprenti.

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1194 messages

Posté 25 June 2011 - 13:25 PM

Ben doit y avoir un antislash qui m'a échappé alors ! :smile:

Merci pour l'info et excellent WE également à tous.

#15 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 25 June 2011 - 20:38 PM

Merci à tous pour vos soumissions. Je suis passé en mode weekend mais lundi première heure, je vous dis ce qu'il en retourne :smile:

Loic

#16 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 27 June 2011 - 08:35 AM

Hello,

Merci à tous, la regexp de Laurent est parfaite !
(?i)company( ltd)?(?!\.\S)

A+ Loic

#17 laurent.tournier

    Ceinture Bleue

  • Members
  • PipPipPipPipPip
  • 81 messages

Posté 27 June 2011 - 09:48 AM

Citation

Merci à tous, la regexp de Laurent est parfaite !
(?i)company( ltd)?(?!\.\S)
A+ Loic

Je rajouterai : … la regex d'Edfred, complétée par…
Bonne journée
Laurent

#18 Loic Aigon

  • Honoris
  • PipPipPipPipPipPipPipPip
  • 1662 messages

Posté 27 June 2011 - 10:05 AM

Voir le messageLaurent Tournier, le 27 June 2011 - 09:48 AM, dit :

Je rajouterai : … la regex d'Edfred, complétée par…
Bonne journée
Laurent
Evidemment ! Dailleurs, je remercie (comme fait plus haut) tous ceux qui ont apporté leur peirre à l'édifice :smile:



1 utilisateur(s) li(sen)t ce sujet

0 membre(s), 1 invité(s), 0 utilisateur(s) anonyme(s)