Robots.txt
Οι λόγοι ποικίλουν.. μπορεί να θέλετε να κρατήσετε κάποιες περιοχές κρυφές, όπως περιοχές με δοκιμαστικό υλικό, υλικό άσχετο με την ιστοσελίδα σας, περιοχές ευαίσθητων δεδομένων κτλ.
Για να δημιουργήσετε ένα robots.txt ακολουθήστε τα παρακάτω βήματα.
1. Δημιουργήστε ένα κενό robots.txt αρχείο με το σημειωματάριο ή όποιο άλλο λογισμικό θέλετε. Είναι πολύ σημαντικό να το αποθηκεύστε το σε Unix File Format γιατί τα Windows αποθηκεύουν ένα παραπανίσιο χαρακτήρα σε κάθε τέλος γραμμής, πράγμα που κάνει το αρχείο μη εκτελέσιμο σε Unix.
2 Το πρώτο πράγμα που συμπληρώνουμε είναι η εντολή
User-agent: * Με αυτή την εντολή βάζουμε περιορισμούς για όλα τα bot των μηχανών. Μπορούμε να θέσουμε περιορισμούς μόνο σε κάποιο συγκεκριμένο bot, πχ User-agent: googlebot3. Μετά ακολουθεί η εντολή Disallow: όπου βάζουμε για τιμές τις περιοχές (φακέλους/αρχεία) που θέλουμε να αποτρέψουμε το index.
Disallow:
/cgi-bin/
/arxeio/sensitive.html
4. Το αρχείο μας θα έχει περίπου την εξής μορφή:
User-agent: *
Disallow:
/cgi-bin/ /arxeio/sensitive.html
5. Το ανεβάζουμε σε ASCII μορφή στον κεντρικό φάκελο (root) της ιστοσελίδας μας και είμαστε έτοιμοι!Disallow:
/cgi-bin/ /arxeio/sensitive.html







