Forums Développement Multimédia

Aller au contenu

Problème Indexation

CMS Silex

5 réponses à ce sujet

#1 Żabojad

    Ceinture Marron

  • Members
  • PipPipPipPipPipPip
  • 114 messages

Posté 15 February 2010 - 20:23 PM

Hello,

J'ai un problème d'indexation chez mon hébergeur.

Lorsque je lance la fonctionnalité d'indexation en ligne via le manager, j'ai le message suivant qui apparaît :

"une erreur est survenue lors de l'enregistrement de vos modifications - veuillez recommencer votre opération"

Du coup, j'ai tenté de l'indexer en local. Ça crée et rempli un dossier search_index dans le dossier de mon site et lorsque je navigue sur les pages, il semble que ça finalise l'indexation en créant les fichiers ".sti". J'ai bien effectué cette manip en local après avoir modifié mon fichier hosts et la config de mon apache pour que les urls soient identiques avec celles de mon site en ligne. J'ai ensuite tenté d'uploader le résultat en ligne et changer les droits du dossier search_index et tout son contenu à 777 mais lorsque je veux ensuite accéder à mon site, j'obtiens le message d'erreur suivant et mon site n'est plus accessible :

Code: Tout sélectionner
Fatal error: Uncaught exception 'Zend_Search_Lucene_Exception' with message 'chmod() [<a href='function.chmod'>function.chmod</a>]:
Operation not permitted' in /home/xxx/public_html/cgi/library/Zend/Search/Lucene/Storage/Directory/Filesystem.php:189
Stack trace:
#0 /home/xxx/public_html/cgi/library/Zend/Search/Lucene/LockManager.php(85): Zend_Search_Lucene_Storage_Directory_Filesystem->createFile('read.lock.file')
#1 /home/xxx/public_html/cgi/library/Zend/Search/Lucene.php(410): Zend_Search_Lucene_LockManager::obtainReadLock(Object(Zend_Search_Lucene_Storage_Directory_Filesystem))
#2 /home/xxx/public_html/cgi/includes/silex_search.php(138): Zend_Search_Lucene->__construct('/home/a7632955/...')
#3 /home/xxx/public_html/cgi/includes/site_editor.php(45): silex_search->find('/home/a7632955/...', 'exactDeeplink:(...')
#4 /home/xxx/public_html/index.php(201): site_editor->getSectionSeoData('zks', 'start')
#5 {main} thrown in /home/a7632955/public_html/cgi/library/Zend/Search/Lucene/Storage/Directory/Filesystem.php  on line 189


En supprimant ce que j'ai uploadé, tout revient dans l'ordre.

Cependant, j'ai besoin de cette fonctionnalité d'indexation. Qu'est-ce qui ne lui plaît pas dans les fichiers que j'ai uploadé ? D'après le message d'erreur, il plante sur un chmod sur le fichier read.lock.file. Mais ce fichier a déjà les droits à 777...

Finalement, j'ai fait un troisième test en supprimant les trois fichiers lock : optimization.lock.file, read.lock.file, write.lock.file et read-lock-processing.lock.file. Le site est de nouveau accessible et le serveur a créé son propre fichier read.lock.file (ce qui peut potentiellement créer des problèmes mais on verra plus tard...)

Mais est-ce que mon site est toujours indexé sans ces quatre fichiers ?

Pourriez-vous svp m'expliquer plus en détails comment fonctionne l'indexation avec Silex ? J'ai compris que Silex créait un équivalent du site en html lisible par les robots des moteurs de recherche. Est-ce qu'il s'agit des fichiers contenus dans le dossier search_index ? (la syntaxe est bizarre quand je les ouvre avec un editeur de texte).

Merci d'avance.

?abojad

#2

  • Guests

Posté 15 February 2010 - 21:04 PM

Bonjour Zabojad
et merci pour ton activité débordante sur ce forum, ça fait avancer les choses :)

Tu fais des trucs hyper compliqués pour moi, mais pour résoudre tes problèmes d'indexation, en attendant la réponse du maître, je te suggère de faire une recherche sur "sitemap" sur ce forum, j'ai déja eu des échanges enrichissants sur ce sujet avec Lexa.

Tu peux aussi jeter un oeil à cet article super intéressant:
http://www.silexlabs.../the-blog/fr/20 ... ing-silex/

Voilà, je n'en dis pas plus, car je suis à la bourre pour la mise en prod de http://www.voiledusud.com.

#3 Żabojad

    Ceinture Marron

  • Members
  • PipPipPipPipPipPip
  • 114 messages

Posté 16 February 2010 - 17:33 PM

Salut pgu001,

Merci pour ta réponse, je regarde ça et reviens plus tard si il me reste des questions...

Au passage, très beau site, félicitations ;) !

A+

?abojad

#4 Żabojad

    Ceinture Marron

  • Members
  • PipPipPipPipPipPip
  • 114 messages

Posté 16 February 2010 - 19:50 PM

Salut,

Me revoilà :) ! Rhooo, Faites pas cette tronche quoi, dès que j'aurai compris, je vous laisserai tranquilles c'est promis :P. Mieux ! j'aiderai même les gens à comprendre à leur tour ^^...

Few questions about indexation, après avoir lu tout ça:

La première, dans cette discussion, lexa nous dit:

lexa a écrit:par exemple sur http://silex-ria.org on a les pages listées ici http://silex-ria.org...emap.php?id_sit ... .flash.cms
il faut désactiver le javascript et regarder la source de la page pour voir que chacune des pages est unique et contient le texte+images de la page équivalente dans silex


Ok pour la sitemap, la mienne me semble OK : http://www.zks-szyndler.pl/sitemap.php

Par contre j'ai désactivé le javascript (à vrai dire, j'ai pas vu de différence avec et sans) et consulté les sources des pages de mon site et j'ai l'impression que pour l'équivalent HTML, il ne prend en compte que le calque racine "start" et pas les autres. Par exemple, sur la page "Firma" de mon site ( http://www.zks-szyndler.pl ), j'ai un équivalent HTML qui se résume à :
Code: Tout sélectionner
HTML EQUIVALENT:</p><H4>This page content</H4><br>
<p><TEXTFORMAT LEADING="2"><P ALIGN="LEFT"><FONT FACE="Arial" SIZE="22" COLOR="#FFFFFF" LETTERSPACING="0" KERNING="0">Kontakt</FONT></P></TEXTFORMAT></p><br>
<p><TEXTFORMAT LEADING="2"><P ALIGN="LEFT"><FONT FACE="Arial" SIZE="22" COLOR="#FFFFFF" LETTERSPACING="0" KERNING="0">Oferta</FONT></P></TEXTFORMAT></p><br>
<p><TEXTFORMAT LEADING="2"><P ALIGN="LEFT"><FONT FACE="Arial" SIZE="22" COLOR="#FFFFFF" LETTERSPACING="0" KERNING="0">Realizacje</FONT></P></TEXTFORMAT></p><br>
<p><TEXTFORMAT LEADING="2"><P ALIGN="LEFT"><FONT FACE="Arial" SIZE="22" COLOR="#FFFFFF" LETTERSPACING="0" KERNING="0">Firma</FONT></P></TEXTFORMAT></p><br>


En gros, il n'a converti que les button.cmp.swf qui se trouvent sur le calque start mais pas les deux textes et l'image qui sont sur start/firma.

Est-ce que ça vient d'une erreur de ma part ? Ou d'une mauvaise interprétation ?

Je rajoute que sur le site http://silex-ria.org, sur la page des contributeurs, je ne vois pas non plus l'équivalent html du contenu du calque "le plus haut" (celui contient la liste des pseudos des contributeurs).


Ma deuxième question au sujet de l'indexation c'est à quoi sert tout ce qui se trouve dans le répertoire "search_index" qui est créé lorsqu'on lance la fonctionnalité d'indexation dans le manager ? Ce n'est pas ce qui est supposé être inclue dynamiquement dans la partie "HTML EQUIVALENT" de chaque page à la navigation ?


Ma troisième question, c'est plus une remarque en fait. Vous le savez sûrement déjà, Google propose un outil pour monitorer l'état de son référencement (ici). Je sais pas encore quelles conséquences ça a mais il semble que Google n'aime pas la syntaxe utilisée pour localiser la sitemap, dans le fichier robots.txt (par défaut dans Silex) :
Code: Tout sélectionner
User-agent: *
Disallow: /cgi/
Disallow: /tools/
Disallow: /contents/
Disallow: /conf/
Disallow: /install/
Disallow: /layouts/
Disallow: /trash/
Disallow: /ui/
Sitemap: /sitemap_index.php


En effet, quand il parse le robots.txt, il génère l'erreur suivante :
Code: Tout sélectionner
Line 10: Sitemap: /sitemap_index.php Invalid sitemap URL detected; syntax not understood


Est-ce que ça vient du fait que l'extension n'est pas en .xml, ou que l'URL est relative et pas absolue, je ne sais pas... Je fais quelques tests et je vous tiens au courant... Si vous avez la réponse évidemment je suis preneur :) !

Merci d'avance pour vos réponses.

?abojad


Vraiment quand je relis mes posts, je me sens vraiment désolé de poser autant de questions...

#5 Żabojad

    Ceinture Marron

  • Members
  • PipPipPipPipPipPip
  • 114 messages

Posté 16 February 2010 - 20:24 PM

Zabojad a écrit:La première, dans cette discussion, lexa nous dit:

lexa a écrit:par exemple sur http://silex-ria.org on a les pages listées ici http://silex-ria.org...emap.php?id_sit ... .flash.cms
il faut désactiver le javascript et regarder la source de la page pour voir que chacune des pages est unique et contient le texte+images de la page équivalente dans silex


Ok pour la sitemap, la mienne me semble OK : http://www.zks-szyndler.pl/sitemap.php

Par contre j'ai désactivé le javascript (à vrai dire, j'ai pas vu de différence avec et sans) et consulté les sources des pages de mon site et j'ai l'impression que pour l'équivalent HTML, il ne prend en compte que le calque racine "start" et pas les autres. Par exemple, sur la page "Firma" de mon site ( http://www.zks-szyndler.pl ), j'ai un équivalent HTML qui se résume à :
Code: Tout sélectionner
HTML EQUIVALENT:</p><H4>This page content</H4><br>
<p><TEXTFORMAT LEADING="2"><P ALIGN="LEFT"><FONT FACE="Arial" SIZE="22" COLOR="#FFFFFF" LETTERSPACING="0" KERNING="0">Kontakt</FONT></P></TEXTFORMAT></p><br>
<p><TEXTFORMAT LEADING="2"><P ALIGN="LEFT"><FONT FACE="Arial" SIZE="22" COLOR="#FFFFFF" LETTERSPACING="0" KERNING="0">Oferta</FONT></P></TEXTFORMAT></p><br>
<p><TEXTFORMAT LEADING="2"><P ALIGN="LEFT"><FONT FACE="Arial" SIZE="22" COLOR="#FFFFFF" LETTERSPACING="0" KERNING="0">Realizacje</FONT></P></TEXTFORMAT></p><br>
<p><TEXTFORMAT LEADING="2"><P ALIGN="LEFT"><FONT FACE="Arial" SIZE="22" COLOR="#FFFFFF" LETTERSPACING="0" KERNING="0">Firma</FONT></P></TEXTFORMAT></p><br>


En gros, il n'a converti que les button.cmp.swf qui se trouvent sur le calque start mais pas les deux textes et l'image qui sont sur start/firma.

Est-ce que ça vient d'une erreur de ma part ? Ou d'une mauvaise interprétation ?

Je rajoute que sur le site http://silex-ria.org, sur la page des contributeurs, je ne vois pas non plus l'équivalent html du contenu du calque "le plus haut" (celui contient la liste des pseudos des contributeurs).


Ok c'est bon je viens de trouver mon erreur. Il ne suffit pas de désactiver le javascript, mais de taper l'url que le robot Google recevrait si il naviguait sur la page, i.e. : http://zks-szyndler.comli.com/?/zks/start/firma

La réponse était bien dans cette article.

Par contre si quelqu'un a la réponse à ma troisième question, je suis toujours preneur ^^.

A+

?abojad

#6 Żabojad

    Ceinture Marron

  • Members
  • PipPipPipPipPipPip
  • 114 messages

Posté 16 February 2010 - 20:53 PM

Ok, ben je pense avoir trouvé la réponse à ma troisième question : les robots de Google, dans leur version actuelle, semblent préférer une URL absolue à une URL relative pour la Sitemap.

Cependant, ça doit être du provisoire de la part de Google vu qu'ils disent eux même "Earlier versions weren't aware of Sitemaps at all, and understood only absolute URLs; anything else was reported as Syntax not understood. The improved version now tells you whether your Sitemap's URL and scope are valid. You can also test against relative URLs with a lot less typing".

Genre les gars, ils disent un truc qu'ils font même pas :D !

Sources: ici et



1 utilisateur(s) li(sen)t ce sujet

0 membre(s), 1 invité(s), 0 utilisateur(s) anonyme(s)

authorised training centre

Centre de Formation Mediabox - Adobe et Apple Authorised Training Center.

Déclaré auprès de la Direction du Travail et de la Formation Professionnelle

Mediabox : SARL au capital de 62.000€ - Numéro d'activité : 11 75 44555 75 - SIRET : 49371646800035

MEDIABOX, 23, rue de Bruxelles, 75009 PARIS

FFP