domenica 1 dicembre 2013

Cos'è il file robots.txt ?

Il file robots.txt permette ai webmaster e agli amministratori di sistema di indicare agli spider dei motori di ricerca quali pagine HTML non debbano essere esaminate.

Lo standard per l'esclusione dei robot/spider si avvale dell'utilizzo di un normale file di testo, da creare attraverso un qualunque text editor (es. Notepad / Blocco Note di Windows). Tale file va chiamato "robots.txt" e contiene, in un particolare formato, delle istruzioni che possono impedire a tutti o alcuni spider il prelievo di alcune o tutte le pagine del sito.
 

Il file robots.txt va creato e pubblicato on-line nella directory principale del sito web. Ad esempio, se il sito ha indirizzo https://www.nomesito.xxx , il file dovrà essere accessibile all'indirizzo https://www.nomesito.xxx/robots.txt.
Tutti gli spider di quei motori di ricerca che hanno deciso di aderire a questo standard e di seguire le indicazioni del file robots.txt, ogni volta che accederanno al sito web, per prima cosa andranno a cercare nella directory principale il suddetto file e, se lo troveranno, seguiranno le direttive contenute al suo interno.

Contenuti del file robots.txt
Il file robots.txt contiene una lista di pagine e directory che gli spider NON possono prelevare.
Ciò significa che non esiste una istruzione per dire allo spider: "puoi prelevare questa pagina" ma esistono solo istruzioni per dirgli: "NON puoi prelevare questa pagina". Non a caso lo standard si chiama Standard per l'esclusione dei robot.
Quanto appena specificato è estremamente importante, in quanto molti degli errori che i webmaster spesso inseriscono nei file robots.txt hanno origine dall'errata comprensione di ciò che è possibile fare con essi.
Se non avete la necessità di impedire ai motodi ricerca di prelevare alcune (o tutte) pagine del vostro sito, allora il file robots.txt non vi serve.

Formato di robots.txt
Il file robots.txt contiene dei record, ognuno dei quali comprende due campi: il campo "User-agent" ed uno o più campi "Disallow".
Il campo User-agent serve ad indicare a quale robot/spider le direttive successive sono rivolte. La sua sintassi è:
User-agent
Il campo Disallow serve a indicare a quali file e/o directory non può accedere lo spider indicato nel campo User-agent. La sintassi di questo campo è:
Disallow

Esempio di un record:
User-agent: googlebot
Disallow: /testi.html
Disallow: /poesie/
Il suddetto record dice a Google ("googlebot" è il nome dello spider di Google) che non gli è permesso prelevare il file testi.html nè accedere alla directory "poesie" e ai suoi contenuti, sottodirectory comprese. Notate come il nome del file è preceduto da un carattere "/" (che indica la directory principale del sito) e come il nome della directory fa uso di un carattere "/" anche in coda.
Il campo User-agent può contenere un asterisco "*", sinonimo di "qualunque spider". Per cui l'esempio seguente dice a tutti gli spider di non prelevare il file temporaneo.html:
User-agent: *
Disallow: /temporaneo.html
Il campo Disallow può contenere un carattere "/" ad indicare "qualunque file e directory". L'esempio che segue impedisce a scooter (lo spider di Altavista) di prelevare qualunque cosa:
User-agent: scooter
Disallow: /
Infine, il campo Disallow può essere lasciato vuoto, ad indicare che non ci sono file o directory di cui si vuole impedire il prelievo. L'esempio seguente mostra come dire a tutti i motori di ricerca di prelevare tutti i file del sito:
User-agent: *
Disallow:

Esempio di un file robots.txt
Come scritto pocanzi, il file robots.txt si compone di uno o più record, ognuno dei quali prende in esame spider differenti. Ecco dunque un esempio completo di file robots.txt, che blocca del tutto Altavista, impedisce a Google l'accesso ad alcuni file e directory e lascia libero accesso a tutti gli altri motori di ricerca.
User-agent: scooter
Disallow: /
User-agent: googlebot
Disallow: /intestazione.html
Disallow: /links.html
Disallow: /temporanei/
Disallow: /cgi-bin/
User-agent: *
Disallow:

Lista degli spider
Di seguito una breve lista con i nomi degli spider dei principali motori di ricerca internazionali:
Spider            Motore di ricerca
========================
googlebot       Google
fast                Fast - Alltheweb
slurp              Inktomi - Yahoo!
scooter           Altavista
mercator         Altavista
Ask Jeeves      Ask Jeeves
teoma_agent   Teoma
ia_archiver     Alexa - Internet Archive
Il nome (User-agent) degli spider di altri motori di ricerca può essere individuato cercando nei log del server HTTP che gestisce il sito web oppure consultando le pagine dei motori di ricerca dedicate ai webmaster. Quasi sempre, vengono indicati i nomi degli spider e come bloccarli usando il file robots.txt.

Altre informazioni utili
Nel caso in cui voleste inserire all'interno del file robots.txt alcuni commenti, potete farlo scrivendo righe di testo il cui primo carattere è un "cancelletto" #. Tali righe verranno completamente ignorate dagli spider dei motori. Esempio:
User-agent: *
# Non voglio che i motori di ricerca cerchino le pagine
# della mia directory "personale".
Disallow: /personale/
Consigliamo di aderire scrupolosamente alla sintassi utilizzata negli esempi riportati. Prestate attenzione a non dimenticare i due punti e lo spazio prima del contenuto del campo.
Quando gli spider non trovano il file robots.txt, si comportano come se avessero ricevuto via libera ed accederanno dunque a tutte le pagine trovate nel sito.

giovedì 28 novembre 2013

Le 500 PASSWORD da evitare

Di seguito troverete un'elenco delle prime 500 peggiori password utilizzate, questa ricerca è stata effettuata nel 2005. Mette in evidenza, come in pochi istanti un utente malintenzionato sia in grado di trovare la vostra password utilizzando una tecnica chiamata di bruteforcing.


n.Top 1-100Top 101-200Top 201-300Top 301-400Top 401-500
1123456porschefirebirdprincerosebud
2passwordguitarbutterbeachjaguar
312345678chelseaunitedamateurgreat
41234blackturtle7777777cool
5pussydiamondsteelersmuffincooper
612345nascartiffanyredsox1313
7dragonjacksonzxcvbnstarscorpio
8qwertycamerontomcattestingmountain
9696969654321golfshannonmadison
10mustangcomputerbond007murphy987654
11letmeinamandabearfrankbrazil
12baseballwizardtigerhannahlauren
13masterxxxxxxxxdoctordavejapan
14michaelmoneygatewayeagle1naked
15footballphoenixgators11111squirt
16shadowmickeyangelmotherstars
17monkeybaileyjuniornathanapple
18abc123knightthx1138raidersalexis
19passicemanpornosteveaaaa
20fuckmetigersbadboyforeverbonnie
216969purpledebbieangelapeaches
22jordanandreaspiderviperjasmine
23harleyhornymelissaou812kevin
24rangerdakotaboogerjakematt
25iwantuaaaaaa1212loversqwertyui
26jenniferplayerflyerssuckitdanielle
27huntersunshinefishgregorybeaver
28fuckmorganpornbuddy4321
292000starwarsmatrixwhatever4128
30testboomerteensyoungrunner
31batmancowboysscoobynicholasswimming
32trustno1edwardjasonluckydolphin
33thomascharleswalterhelpmegordon
34tiggergirlscumshotjackiecasper
35robertbooboobostonmonicastupid
36accesscoffeebravesmidnightshit
37lovexxxxxxyankeecollegesaturn
38busterbulldogloverbabygemini
391234567ncc1701barneycuntapples
40soccerrabbitvictorbrianaugust
41hockeypeanuttuckermark3333
42killerjohnprincessstartrekcanada
43georgejohnnymercedessierrablazer
44sexygandalf5150leathercumming
45andrewspankydoggie232323hunting
46charliewinterzzzzzz4444kitty
47supermanbrandygunnerbeavisrainbow
48assholecompaqhorneybigcock112233
49fuckyoucarlosbubbahappyarthur
50dallastennis2112sophiecream
51jessicajamesfredladiescalvin
52pantiesmikejohnsonnaughtyshaved
53pepperbrandonxxxxxgiantssurfer
541111fendertitsbootysamson
55austinanthonymemberblondekelly
56williamblowmeboobsfuckedpaul
57danielferraridonaldgoldenmine
58golfercookiebigdaddy0king
59summerchickenbroncofireracing
60heathermaverickpenissandra5555
61hammerchicagovoyagerpookieeagle
62yankeesjosephrangerspackershentai
63joshuadiablobirdieeinsteinnewyork
64maggiesexsextroubledolphinslittle
65bitemehardcorewhite0redwings
66enter666666topgunchevysmith
67ashleywilliebigtitswinstonsticky
68thunderwelcomebitcheswarriorcocacola
69cowboychrisgreensammyanimal
70silverpanthersuperslutbroncos
71richardyamahaqazwsx8675309private
72fuckerjustinmagiczxcvbnmskippy
73orangebananalakersnipplesmarvin
74merlindriverrachelpowerblondes
75michellemarineslayervictoriaenjoy
76corvetteangelsscottasdfghgirl
77bigdogfishing2222vaginaapollo
78cheesedavidasdftoyotaparker
79matthewmaddogvideotravisqwert
80121212hooterslondonhotdogtime
81patrickwilson7777parissydney
82martinbuttheadmarlbororockwomen
83freedomdennissrinivasxxxxvoodoo
84gingerfuckinginternetextrememagnum
85blowjobcaptainactionredskinsjuice
86nicolebigdickcartereroticabgrtyu
87sparkychesterjasperdirty777777
88yellowsmokeymonsterforddreams
89camaroxavierteresafreddymaxwell
90secretstevenjeremyarsenalmusic
91dickviking11111111access14rush2112
92falconsnoopybillwolfrussia
93taylorbluecrystalnipplescorpion
94111111eaglespeteriloveyourebecca
95131313winnerpussiesalextester
96123123samanthacockfloridamistress
97bitchhousebeerericphantom
98hellomillerrocketlegendbilly
99scooterflowerthemanmovie6666
100pleasejackoliversuccessalbert

giovedì 21 novembre 2013

10 consigli per una perfetta PASSWORD

Le dieci principali regole per avere una password a prova di hacker
 

Le dieci regole d'oro per avere una password a prova di hacker, una parola segreta, sicura e facile da ricordare senza sforzi.
Spesso mi viene posta la domanda... "Che password devo mettere?"
La risposta sembrerebbe banale, del tipo "quella che preferisce!"... In realtà credo che sia il caso di approfondire l'argomento puntualizzando su alcuni concetti fondamentali:

Qualsiasi password venga creata dovrebbe essere la più sicura possibile!

Troppe persone sottovalutano la loro "dipendenza dall'informatica", ad esempio le e-mail stanno diventando un meccanismo di comunicazione sempre più utilizzato.
Quando poi, l'email rappresenta anche una parte del proprio lavoro, allora è realmente indispensabile non correre rischi.
Parlando di sicurezza viene subito in mente il problema che qualcuno possa leggere la nostra mail!, così si accantona il fatto, ritenendo di non avere nessun particolare segreto da nascondere: l'eventuale intruso troverebbe ben poco! La situazione reale è molto diversa, il rischio non è solo sulla privacy ma molto più sulla disponibilità del servizio. Un intrusore dispettoso potrebbe semplicemente decidere di cambiare la nostra password e tutti i dati di registrazione: abbiamo perso il controllo della casella di posta, un danno non indifferente.
Come faccio a sapere se la mia password è abbastanza sicura? basta seguire alcune semplici ma efficaci regole:

e dieci regole per avere una password Strong
Queste semplici regole ci permetteranno di ricordare più facilmente anche password molto complesse.

1) - Utilizzare un minimo di 8 caratteri per la lunghezza della vostra password, l'ideale sarebbe una lunghezza di almeno dieci (10) o dodici (12) caratteri;

2) - Utilizzare un mix di caratteri alfanumerici, ovvero tutti quei caratteri compresi fra "a" e "z" e fra "0" e "9"

3) - Utilizzare sia caratteri MAIUSCOLI e minuscoli es: A/a, B/b,...Z/z che tutti quei caratteri considerati "speciali" come, "$ % & ( @ # § = ) , : ; - _ + ^";

4) - NON Utilizzare, parole che vi identificano facilmente quali per esempio: il nome o il cognome, vostro, di vostra moglie o dei vostri cari; le date di compleanno; il numero di targa della vostra auto o il numero di cellulare, o altre banalità similari.

5) - NON utilizzare, parole ovvie come ad esempio: password, pippo, pluto, 123456, qwerty, pussy, 696969, mustang, etc...

6) - Cercare di NON utilizzare parole reali, eventualmente sostituite le lettere con il loro"uguale" numerico, come ad esempio la parola "pessimista" potrebbe diventare "p355im1stA" ancora meglio se si aggiungono caratteri speciali "P3S5!m1ST@"

7) - Un'altro metodo per creare una password facilmente ricordabile, è quello di pensare per esempio al film preferito ed utilizzarne una frase famosa, come: "domani è un altro giorno e si vedrà" prendendo le lettere iniziali e/o finali di ogni singola parola, per costruire la password es:"DièUnaOGesiVà" o ancora meglio "D13'Un@OGe5iV@'"

8) - Cambiare regolarmente la password per lo meno quelle di importanza strategica, il cambio andrebbe effettuato, almeno una volta ogni 2 o tre mesi.

9) - ASSOLUTAMENTE EVITARE di utilizzare sempre la medesima password per tutte le innumerevoli richieste di accesso, sia esse al lavoro che a casa.

10) - Se avete l'abitudine di tenere una traccia scritta delle vostre password, assicuratevi che tale traccia sia conservata lontano da occhi indiscreti e al sicuro. Evitate di scrivere le password sul cellulare o nel classico foglietto sulla scrivania dell'ufficio, o all'interno del portafogli.

Ultimo Post inserito

In Italia arriva "PIZZA GPT" il clone di ChatGpt per gl'italiani