Usando a máquina Wayback

3 days ago
20

Usando a máquina Wayback
Central de Ajuda do Internet Archive
Usando a máquina Wayback
Este vídeo de introdução fornece uma visão geral de como usar o Wayback Machine, incluindo informações sobre como pesquisar por URL ou palavra-chave, entender a procedência e salvar suas próprias páginas, além de outros recursos.

Posso criar links para páginas antigas no Wayback Machine?

Sim! A Wayback Machine foi criada para poder ser usada e referenciada. Se você encontrar uma página arquivada que gostaria de referenciar em sua página da Web ou em um artigo, poderá copiar o URL. Você pode até usar correspondência de URL difusa e especificação de data… mas isso é um pouco mais avançado.

Como posso usar a Pesquisa de Sites da Wayback Machine para encontrar sites?

O recurso de Pesquisa de Site da Wayback Machine é baseado em um índice criado pela avaliação de termos de centenas de bilhões de links para as páginas iniciais de mais de 350 milhões de sites. Os resultados da pesquisa são classificados pelo número de capturas no Wayback e pelo número de links relevantes para a página inicial do site.

Posso pesquisar no Arquivo?

Usando o Internet Archive Wayback Machine, é possível pesquisar os nomes dos sites contidos no Arquivo (URLs) e especificar intervalos de datas para sua pesquisa. Esperamos implementar um mecanismo de busca de texto completo em algum momento no futuro.

Por que o site que estou procurando não está no arquivo?

Alguns sites podem não ser incluídos porque os rastreadores automatizados não sabiam de sua existência no momento do rastreamento. Também é possível que alguns sites não tenham sido arquivados porque estavam protegidos por senha, bloqueados pelo robots.txt ou de outra forma inacessíveis aos nossos sistemas automatizados. Os proprietários de sites também podem ter solicitado que seus sites fossem excluídos da Wayback Machine.

Como posso excluir ou remover as páginas do meu site do Wayback Machine?

Se desejar enviar uma solicitação para que os arquivos do seu site ou conta sejam excluídos do web.archive.org, envie-nos uma solicitação para [email protected] e indicar:

o URL ou URLs do material
o período de tempo que você deseja excluir
o período de tempo durante o qual você teve o controle do site ou da conta de usuário relevante (se aplicável) e
qualquer outra informação que você ache que seria útil para entendermos melhor sua solicitação.
Isso iniciará uma revisão por nossa equipe. Não oferecemos nenhuma garantia prévia sobre o resultado de uma solicitação.

Como posso usar a Pesquisa de Sites da Wayback Machine para encontrar sites?

O recurso de Pesquisa de Site da Wayback Machine é baseado em um índice criado pela avaliação de termos de centenas de bilhões de links para as páginas iniciais de mais de 350 milhões de sites. Os resultados da pesquisa são classificados pelo número de capturas no Wayback e pelo número de links relevantes para a página inicial do site.

Como posso obter uma cópia das páginas do meu site? Se meu site for hackeado ou danificado, posso obter um backup do Arquivo?

Nossos termos de uso não abrangem backups para o público em geral. No entanto, você pode usar o Internet Archive Wayback Machine para localizar e acessar versões arquivadas de um site sobre o qual você detém os direitos. Não podemos garantir que seu site foi ou será arquivado. Não podemos mais oferecer o serviço para empacotar sites que foram perdidos.

Posso adicionar páginas à Wayback Machine?

Em https://archive.org/web você pode usar o recurso “Salvar página agora” para salvar uma página específica uma vez. Atualmente, isso não adiciona o URL a nenhum rastreamento futuro nem salva mais do que essa página. Ele não salva várias páginas, diretórios ou sites inteiros.

Onde está o resto do site arquivado? Por que estou recebendo imagens quebradas ou cinza em um site?

Imagens quebradas ocorrem quando as imagens não estão disponíveis em nossos servidores. Normalmente isso significa que não os arquivamos.

Você pode saber se a imagem ou link que está procurando está no Wayback Machine inserindo o URL da imagem ou link na caixa de pesquisa do Wayback Machine. Quaisquer arquivos que tenhamos podem ser visualizados na Wayback Machine.

A melhor maneira de ver todos os arquivos que arquivamos do site é: http://web.archive.org/*/www.yoursite.com/*

Há um intervalo de 3 a 10 horas entre o momento em que um site é rastreado e quando ele aparece na Wayback Machine.

Por que alguns sites são mais difíceis de arquivar do que outros?

Se você olhar nossa coleção de sites arquivados, encontrará algumas páginas quebradas, gráficos ausentes e alguns sites que não estão arquivados. Algumas das coisas que podem causar isso são:

Robots.txt — A site’s robots.txt document may have prevented the crawling of a site.
Javascript — Javascript elements are often hard to archive, but especially if they generate links without having the full name in the page. Plus, if javascript needs to contact the originating server in order to work, it will fail when archived.
Server side image maps — Like any functionality on the web, if it needs to contact the originating server in order to work, it will fail when archived.
Orphan pages — If there are no links to your pages, the robot won’t find it (the robots don’t enter queries in search boxes.)
As a general rule of thumb, simple html is the easiest to archive.
Can I find sites by searching for words that are in their pages?

No, at least not yet. Site Search for the Wayback Machine will help you find the homepages of sites, based on words people have used to describe those sites, as opposed to words that appear on pages from sites.

Can I still find sites in the Wayback Machine if I just know the URL?

Yes, just enter a domain or URL the way you have in the past and press the “Browse History” button.

Why are some of the dots on the calendar page different colors?

We color the dots, and links, associated with individual web captures, or multiple web captures, for a given day. Blue means the web server result code the crawler got for the related capture was a 2nn (good); Green means the crawlers got a status code 3nn (redirect); Orange means the crawler got a status code 4nn (client error), and Red means the crawler saw a 5nn (server error). Most of the time you will probably want to select the blue dots or links.

How does the Wayback Machine behave with Javascript turned off?

If you have Javascript turned off, images and links will be from the live web, not from our archive of old Web files.

How did I end up on the live version of a site? or I clicked on X date, but now I am on Y date, how is that possible?

Not every date for every site archived is 100% complete. When you are surfing an incomplete archived site the Wayback Machine will grab the closest available date to the one you are in for the links that are missing. In the event that we do not have the link archived at all, the Wayback Machine will look for the link on the live web and grab it if available. Pay attention to the date code embedded in the archived url. This is the list of numbers in the middle; it translates as yyyymmddhhmmss. For example in this url http://web.archive.org/web/20000229123340/http://www.yahoo.com/ the date the site was crawled was Feb 29, 2000 at 12:33 and 40 seconds.

You can see a listing of the dates of the specific URL by replacing the date code with an asterisk (*), ie: http://web.archive.org/*/www.yoursite.com

How do I cite Wayback Machine urls in MLA format?

This question is a newer one. We asked MLA to help us with how to cite an archived URL in correct format. They did say that there is no established format for resources like the Wayback Machine, but it’s best to err on the side of more information. You should cite the webpage as you would normally, and then give the Wayback Machine information. They provided the following example: McDonald, R. C. “Basic Canary Care.” _Robirda Online_. 12 Sept. 2004. 18 Dec. 2006 [http://www.robirda.com/cancare.html]. _Internet Archive_. [ http://web.archive.org/web/20041009202820/http://www.robirda.com/cancare.html]. They added that if the date that the information was updated is missing, one can use the closest date in the Wayback Machine. Then comes the date when the page is retrieved and the original URL. Neither URL should be underlined in the bibliography itself. Thanks MLA!

How can I get pages authenticated from the Wayback Machine? How can I use the pages in court? While the Wayback Machine tool was not expressly designed with legal use in mind, we receive regular requests for certified records for use in legal proceedings. Our affidavit request procedure can be found here. Please review that information including our standard affidavit and the legal request FAQ section linked there to prior to contacting us.

Some sites are not available because of robots.txt or other exclusions. What does that mean?

Such sites may have been excluded from the Wayback Machine due to a robots.txt file on the site or at a site owner’s direct request.

How can I get my site included in the Wayback Machine?

Much of our archived web data comes from our own crawls or from Alexa Internet’s crawls. Neither organization has a “crawl my site now!” submission process. Internet Archive’s crawls tend to find sites that are well linked from other sites. The best way to ensure that we find your web site is to make sure it is included in online directories and that similar/related sites link to you.

Alexa Internet uses its own methods to discover sites to crawl. It may be helpful to install the free Alexa toolbar and visit the site you want crawled to make sure they know about it.

Regardless of who is crawling the site, you should ensure that your site’s ‘robots.txt’ rules and in-page META robots directives do not tell crawlers to avoid your site.

What is the Archive-It service of the Internet Archive’s Wayback Machine?

For information on the Archive-It subscription service that allows institutions to build and preserve collections of born digital content, see https://www.archive.org/about/faqs.php#Archive-It.

Search
Search
Accounts
Archive-it Service
Archive.org
Archive.org General Information
Audio and Music Items Information
Books and Texts Information
Borrow a Book from Archive.org
Charges & Refunds
Collections
Disability Access
Donating Physical Items to the Archive
Donating to the Internet Archive
Donations
Downloading
Favorites
Files, Formats, and Derivatives
Forums
General Interest
Lists
Managing and Editing Your Items
Media Players
Most Frequently Asked Questions
Movies and Videos
Organization Information
Reporting problems or errors
Reports
Search
Software
Tax Information
Technical Information
The Wayback Machine
Uploading
Wayback Machine & Web Archiving
Recent Posts
Perguntas frequentes sobre o Programa de Biblioteca Depositária Federal (FDLP)
E se eu estiver com problemas para doar?
Pesquisar – Construindo consultas poderosas e complexas
Aplicativo Doe Livros para iOS e Android
Por que tantos livros estão listados como “Emprestar indisponível” no Internet Archive

Loading comments...