{"id":29096,"date":"2021-08-14T13:25:45","date_gmt":"2021-08-14T13:25:45","guid":{"rendered":"https:\/\/www.conectasoftware.com\/glossary\/crawling\/"},"modified":"2023-07-06T22:18:46","modified_gmt":"2023-07-06T22:18:46","slug":"crawling","status":"publish","type":"glossary","link":"https:\/\/www.conectasoftware.com\/magazine\/glosario\/crawling\/","title":{"rendered":"Crawling<span class=\"dashicons \" data-icon=\"\" style=\"color:#000;display:inline;vertical-align:baseline;\"><\/span>"},"content":{"rendered":"<p><span style=\"font-weight: 400;\">Crawling, tambi\u00e9n conocido como rastreo de sitios web, es el recorrido que lleva a cabo un crawler (bot de software) a trav\u00e9s del contenido de un sitio web. Para ello, va saltando entre los enlaces del sitio web que va encontrando.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Dado que todo sitio web actualmente enfoca su posicionamiento en el buscador de Google, el crawler de Google (llamado GoogleBot) funciona de igual manera, accede a un sitio web en particular, analiza su contenido y posteriormente, lo introduce en su \u00edndice. Si se aprovecha de buena forma es la herramienta ideal para escalar puestos en las SERPs de los buscadores, generando m\u00e1s tr\u00e1fico, alcanzando a un mayor n\u00famero de usuarios, mejorando la presencia en la red.\u00a0<\/span><\/p>\n<h2><b>Tipos de bots de Google<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">Antes hemos nombrado a GoogleBot, que es el robot de Google encargado de rastrear los sitios web. Adem\u00e1s, podemos encontrar algunos subtipos del mismo:<\/span><\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Para la versi\u00f3n m\u00f3vil est\u00e1 <\/span><b>Googlebot smartphones<\/b><span style=\"font-weight: 400;\">.<\/span><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Para la versi\u00f3n escritorio est\u00e1 <\/span><b>Googlebot desktop<\/b><span style=\"font-weight: 400;\">.<\/span><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">El encargado de rastrear las im\u00e1genes es <\/span><b>Googlebot Images<\/b><span style=\"font-weight: 400;\">.<\/span><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">El encargado de rastrear las noticias es <\/span><b>Googlebot News<\/b><span style=\"font-weight: 400;\">.<\/span><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">El encargado de rastrear los v\u00eddeos es <\/span><b>Googlebot Video<\/b><span style=\"font-weight: 400;\">.\u00a0<\/span><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h2><b>Crawling, \u00bfcu\u00e1l es su uso?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">El cometido principal del crawling es repasar todos los enlaces y el contenido de un sitio web para indexar tanto lo nuevo como lo modificado en los buscadores. B\u00e1sicamente sirve para que todo el contenido nuevo y\/o modificado aparezca en Google.<\/span><\/p>\n<h3><b>Crawl Budget, \u00bfqu\u00e9 es?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Aunque no parezca real, Google est\u00e1 limitado en cuanto a recursos. Google asigna a sus crawlers un tiempo para el rastreo, conocido como crawl budget (presupuesto de rastreo). Este presupuesto es asignado en funci\u00f3n de la <\/span><b>autoridad del sitio web, la calidad, la accesibilidad <\/b><span style=\"font-weight: 400;\">y<\/span><b> la velocidad<\/b><span style=\"font-weight: 400;\">.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Se recomienda optimizar el crawl budget cuando los sitios web cuentan con m\u00e1s de 5000 Urls.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Hace algunos a\u00f1os, si estabas interesado en conocer cu\u00e1l es el crawl budget de tu sitio web, pod\u00edas consultarlo a trav\u00e9s de Search Console, una de las herramientas m\u00e1s conocidas para aquellos que se dedican al SEO. En la actualidad, Google ha deshabilitado esa opci\u00f3n.\u00a0<\/span><\/p>\n<h2><b>Crawling. Elementos interesantes<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">Dado que no se sabe cu\u00e1l es la f\u00f3rmula que hace que un sitio web se posicione en las primeras posiciones de las SERP, s\u00ed que se debe tener en cuenta algunos elementos que hacen de ayuda para subir a las primeras posiciones de las mismas:<\/span><\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">La <\/span><b>usabilidad<\/b><span style=\"font-weight: 400;\"> y <\/span><a href=\"https:\/\/www.w3c.es\/Traducciones\/es\/WAI\/intro\/accessibility\" target=\"_blank\" rel=\"noopener\"><b>accesibilidad<\/b><\/a><span style=\"font-weight: 400;\"> de una web son fundamentales. La experiencia de usuario es uno de los principales elementos a tener en cuenta. Si un usuario no entiende c\u00f3mo funciona un sitio web, lo m\u00e1s probable es que abandone dicho sitio web. Adem\u00e1s, la accesibilidad abre las puertas de acceso a la informaci\u00f3n a aquellos usuarios que tienen alg\u00fan tipo de discapacidad.\u00a0<\/span><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Aplicaci\u00f3n de <\/span><b>buenas pr\u00e1cticas en el SEO <a href=\"https:\/\/www.conectasoftware.com\/magazine\/marketing-digital\/seo-on-page-y-off-page-diferencias-y-posicionamiento\/\">on-page<\/a><\/b><span style=\"font-weight: 400;\">. Cuando se desarrolla un sitio web, se debe tener en cuenta aplicar buenas pr\u00e1cticas t\u00e9cnicas, como desarrollar un \u00e1rbol de categor\u00edas \u00f3ptimo, aplicar atributos <\/span><i><span style=\"font-weight: 400;\">alt <\/span><\/i><span style=\"font-weight: 400;\">en las im\u00e1genes u optimizar el renderizado del sitio web.\u00a0<\/span><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"font-weight: 400;\"><span style=\"font-weight: 400;\">Ofrecer <\/span><b>contenido de calidad y original<\/b><span style=\"font-weight: 400;\"> generando adem\u00e1s dicho contenido de manera diaria, lo que har\u00e1 entender a Google que el sitio web se encuentra \u201cvivo\u201d.\u00a0<\/span><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Crawling, tambi\u00e9n conocido como rastreo de sitios web, es el recorrido que lleva a cabo un crawler (bot de software) a trav\u00e9s del contenido de un sitio web. Para ello, va saltando entre los enlaces del sitio web que va encontrando. Dado que todo sitio web actualmente enfoca su posicionamiento en el buscador de Google, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":25647,"menu_order":0,"template":"","meta":{"content-type":"","footnotes":""},"glossary-categories":[94],"glossary-tags":[],"glossary-languages":[],"class_list":{"0":"post-29096","1":"glossary","2":"type-glossary","3":"status-publish","4":"has-post-thumbnail","6":"glossary-categories-seo"},"_links":{"self":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary\/29096","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary"}],"about":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/types\/glossary"}],"author":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary\/29096\/revisions"}],"predecessor-version":[{"id":37825,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary\/29096\/revisions\/37825"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media\/25647"}],"wp:attachment":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media?parent=29096"}],"wp:term":[{"taxonomy":"glossary-categories","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary-categories?post=29096"},{"taxonomy":"glossary-tags","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary-tags?post=29096"},{"taxonomy":"glossary-languages","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary-languages?post=29096"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}