Forum nom de domaine  

Revenir en arrière   Forum nom de domaine > L'industrie des noms de domaine > Développement

Répondre
 
LinkBack Outils du sujet Note Affichage du sujet
  #1 (permalien)  
Ancien 25/12/2015, 10h48
Avatar de domaine1
domaine1 (Déconnecté)
Yoda
 
Inscrit : mars 2008
Messages: 2 821
Chats: 2105
Par défaut Comment désindexer des dizaines de milliers de pages qui n'existent plus ?

Bonjour,
il y a un peu plus de 3 mois, j'ai eu des dizaines de milliers de pages de spams en japonais sur mes sites, après que quelqu'un ait pris le contrôle du ftp.
J'ai supprimé ces pages quelques jours après et envoyé des sitemaps, mais elles continuent à être indexées. Comment faire pour ne plus les indexer ?

Par exemple site:davidchelly.com donne des milliers de pages qui n'existent pas. Le sitemap est ici :
http://www.davidchelly.com/sitemap.xml

Est-ce qu'il y aurait une instruction avec robots.txt ou htaccess ? Toutes les pages à supprimer commencent par eat-

merci !
__________________
DomaineExpire.com - Boostez votre SEO avec des domaines expirés
Site-a-vendre-fr.com - Achat et vente de sites internet
Referencement-rapide.net - Netlinking haut de gamme
Répondre en citant
  #2 (permalien)  
Ancien 26/12/2015, 12h01
Avatar de Didier
Didier (Déconnecté)
Membre senior
 
Inscrit : novembre 2012
Messages: 126
Chats: 120
Par défaut Re : Comment désindexer des dizaines de milliers de pages qui n'existent plus ?

Bonjour David,

Il me semble que l'on ne desindexe pas des pages mais INDEXE les bonnes.

A tu compte dans Google Webmaster & Bing Webmaster?

Tu a un sitemap c'est bien.
Est il soumis dans les outils Webmaster ou a tu indexé(ping) les pages?

Ton url racine est première dans Google suivie de +8500 pages d'ancien spam retournant en 404.
Ca fait combien de temps que tu a réparer ceci et surtout combien de temps sont restée indexée les milliers de pages de spam?

Noter que Bing ne comporte aucune mauvaises pages
Contrairement à Google pour la commande site:davidchelly.com


A tu des messages/alertes/recommandations dans ton Google webmaster concernant ce site?

Dernière modification de Didier, 26/12/2015 à 19h28
Répondre en citant
  #3 (permalien)  
Ancien 27/12/2015, 10h35
Avatar de domaine1
domaine1 (Déconnecté)
Yoda
 
Inscrit : mars 2008
Messages: 2 821
Chats: 2105
Par défaut Re : Comment désindexer des dizaines de milliers de pages qui n'existent plus ?

merci Didier,
apparemment, les instructions ici donnent la réponse :

https://sites.google.com/site/webmas...et-repertoires


il faut indiquer à google que les pages n'existent plus, le sitemap et le fait de les supprimer ne suffit pas.
J'ai juste rajouté un fichier .htaccess comme google le conseille et ça devrait être résolu. Sur les ndd qui ont été spammés où j'avais un fichier htaccess, les pages ont disparu en qq jours.
Ca devrait être bon maintenant
__________________
DomaineExpire.com - Boostez votre SEO avec des domaines expirés
Site-a-vendre-fr.com - Achat et vente de sites internet
Referencement-rapide.net - Netlinking haut de gamme
Répondre en citant
  #4 (permalien)  
Ancien 27/12/2015, 10h43
Avatar de Didier
Didier (Déconnecté)
Membre senior
 
Inscrit : novembre 2012
Messages: 126
Chats: 120
Par défaut Re : Comment désindexer des dizaines de milliers de pages qui n'existent plus ?

Merci David pour le lien je n'avais pas trouvé cette info.
Je met en signet!
Répondre en citant
  #5 (permalien)  
Ancien 04/01/2016, 15h41
Avatar de ruben
ruben (Déconnecté)
Super Modérateur
 
Inscrit : mars 2008
Lieu: Lyon
Messages: 1 784
Chats: 1090
Envoyer un message avec Skype™ à ruben
Par défaut Re : Comment désindexer des dizaines de milliers de pages qui n'existent plus ?

Tu peux essayer de rediriger ta page d'erreur 404 (qui ne recense certainement que des erreurs liées aux anciennes pages spammées) en 301 vers une page neutre sur laquelle tu ajoutes une balise meta noindex.

Donc en gros je configurerais comme page 404 une page en php (via ton htacess)
Dans un deuxième temps je créerais une page neutre de type pageneutre.php

Sur la page 404.php j'ajouterai un code du genre :
<?php
header("Status: 301 Moved Permanently", false, 301);
header("Location: http://www.tonsite.com/pageneutre.php");
exit();
?>
et sur pageneutre.php dans le META je mettrais :

<meta name="robots" content="noindex,nofollow" />
Répondre en citant
  #6 (permalien)  
Ancien 05/01/2016, 13h22
Avatar de ruben
ruben (Déconnecté)
Super Modérateur
 
Inscrit : mars 2008
Lieu: Lyon
Messages: 1 784
Chats: 1090
Envoyer un message avec Skype™ à ruben
Par défaut Re : Comment désindexer des dizaines de milliers de pages qui n'existent plus ?

Actuellement tes anciennes URL spam sont redirigées vers ta homepage en 302 qui est une redirection temporaire. Google ne désindexe donc pas les pages. Il faut que tu fasses une redirection permanente 301. Je te conseille également comme expliqué dans message plus haut de ne pas rediriger toutes ces pages vers ton Index. Si tu utilises une page neutre non indexée tu peux sans soucis à partir de cette dernière refaire une redirection vers ta Home. Il faut juste que celle-ci ne soit pas interprétée par GG. Tu peux faire une redirection Meta refresh en mettant un timing à 5s par exemple.

Dernière modification de ruben, 05/01/2016 à 13h28
Répondre en citant
  #7 (permalien)  
Ancien 05/01/2016, 13h47
Avatar de domaine1
domaine1 (Déconnecté)
Yoda
 
Inscrit : mars 2008
Messages: 2 821
Chats: 2105
Par défaut Re : Comment désindexer des dizaines de milliers de pages qui n'existent plus ?

Envoyé par ruben Voir le message
Actuellement tes anciennes URL spam sont redirigées vers ta homepage en 302 qui est une redirection temporaire. Google ne désindexe donc pas les pages. Il faut que tu fasses une redirection permanente 301. Je te conseille également comme expliqué dans message plus haut de ne pas rediriger toutes ces pages vers ton Index. Si tu utilises une page neutre non indexée tu peux sans soucis à partir de cette dernière refaire une redirection vers ta Home. Il faut juste que celle-ci ne soit pas interprétée par GG. Tu peux faire une redirection Meta refresh en mettant un timing à 5s par exemple.
merci bien Alex de ce message et du précédent,
mon htaccess est :

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.davidchelly\.com [NC]
RewriteRule (.*) http://www.davidchelly.com/$1 [QSA,R=301,L]
ErrorDocument 404 David Chelly : sites et stratégie internet, noms de domaine

L'instruction ErrorDocument met du 302 par défaut ? Je dois utiliser une autre syntaxe ?
__________________
DomaineExpire.com - Boostez votre SEO avec des domaines expirés
Site-a-vendre-fr.com - Achat et vente de sites internet
Referencement-rapide.net - Netlinking haut de gamme
Répondre en citant
  #8 (permalien)  
Ancien 06/01/2016, 13h58
Avatar de ruben
ruben (Déconnecté)
Super Modérateur
 
Inscrit : mars 2008
Lieu: Lyon
Messages: 1 784
Chats: 1090
Envoyer un message avec Skype™ à ruben
Par défaut Re : Comment désindexer des dizaines de milliers de pages qui n'existent plus ?

Selon moi pour avoir une vraie erreur 404 tu ne dois pas avoir une redirection vers une url absolue mais du type :
ErrorDocument 404 /404.php
Cela dit je trouve étonnant que ça renvoie une 302. Edit : je pensais que l'utilisation d'une URL absolu transmettait un code 200, mais visiblement ça peut aussi renvoyer un 302.
Pour info des pages qui n'existeront plus jamais devraient être en 410.

Dernière modification de ruben, 06/01/2016 à 14h08
Répondre en citant
Répondre

Outils du sujet
Affichage du sujet Noter ce sujet
Noter ce sujet:

Règles des messages
Vous ne pouvez pas créer de sujets
Vous ne pouvez pas répondre aux sujets
Vous ne pouvez pas importer de fichiers joints
Vous ne pouvez pas modifier vos messages

BB codes : Activé
Smileys : Activé
BB code [IMG] : Activé
Code HTML : Désactivé
Trackbacks are Activé
Pingbacks are Activé
Refbacks are Activé


Sujets similaires
Sujet Auteur du sujet Forum Réponses Dernier message
AdopteUnDomaine.com : Des milliers de domaines expirés ! Kados Offres publicitaires 12 09/12/2013 07h39
MailClub.info : Quelques milliers de .TEL robot Agrégateur 2 22/12/2008 09h48


Fuseau horaire : GMT +1. Il est 17h34.

Forum protégé par le Code de la propriété littéraire et artistique.