É assim que podemos explorar a internet depois do Google
Os algoritmos podem usar o conhecimento coletivo para nos tornar todos exploradores da Internet?

- O Google tem sido investigado recentemente por seu domínio sobre o fluxo de informações na internet.
- TagTheWeb está pesquisando um método para permitir que a 'sabedoria da multidão' categorize a internet de forma mais eficaz.
- Com ou sem o Google, a Internet parece mudar significativamente no futuro, de maneiras para as quais talvez não estejamos preparados.
A internet está sempre mudando. Atingiu um bilhão de sites em 2014 e provavelmente arrecadará outro bilhão no próximo ano. Sobre Estatísticas ao vivo da Internet , os contadores de pesquisas do Google, e-mails enviados e tweets tweetados aumentam mais rápido do que o NÓS. Dívida nacional . No momento em que este livro foi escrito, o tráfego da Internet hoje somava 5 bilhões de gigabytes de dados.
Este suprimento de dados é incompreensivelmente grande - demais para qualquer um percorrer apenas para descobrir qual filme é estrelado por Bruce Campbell como um Elvis Presley caçador de múmias. Claramente, precisamos de um curador para examinar esses dados e nos informar que Campbell começou seu uh-huh em Bubba Ho-Tep .
Para muitos, o Google é o curador preferido e, no que diz respeito aos curadores de suseranos, o Google é ótimo. Suas pesquisas são rápidas e responsivas. Ele limita grandes quantidades de spam e domínios estacionados de aparecer em seus resultados. E aqueles rabiscos e ovos de Páscoa são uma explosão.
Mas alguns pesquisadores estão procurando uma nova maneira de navegar na internet, que não exija o Google.
Como o Google faz a curadoria da internet para você

Crédito da foto: Arthur Osipyan via Unsplash
Mecanismos de busca como o Google construir seus índices por meio de um processo chamado rastreamento da web . Os rastreadores da web exploram páginas da web para reunir dados sobre seu conteúdo, links, palavras-chave e semelhantes. Os rastreadores enviam esses dados de volta ao mecanismo de pesquisa, onde um algoritmo os usa para criar um índice de páginas. Quando você insere os termos de pesquisa, o algoritmo combina esses termos com seu índice e exibe os resultados com base em seu sistema de classificação interno.
Essa é a receita básica para o molho do mecanismo de pesquisa. Mas cada mecanismo diferente adiciona seus próprios ingredientes proprietários a seus algoritmos, como velocidade, número de páginas da web rastreadas, como ele pesa o conteúdo de um site da Web e quais informações ele possui para personalizar seus resultados. Basicamente, assim como todos os restaurantes italianos usam tomates como base de seu molho marinara, mas cada molho é único com base em sua combinação de orégano, manjericão e (Deus me livre!) Cogumelos.
Você deve ter notado um problema potencial aqui. Embora o Google faça um excelente trabalho de navegação na Internet para você, ele é o responsável. Você vê os sites que ele escolhe para você e tem pouco controle sobre como seu algoritmo decide quais sites atendem às suas necessidades. Por exemplo, no ano passado, a União Europeia acusou o Google de violar a lei antitruste por manipulando seus resultados de pesquisa para favorecer os produtos do Google.
Esse domínio sobre o fluxo de informações tem consequências, não só para a concorrência do Google, mas também para as informações disponíveis para o usuário. É aí que entra o TagTheWeb.
Muitas mãos fazem categorizações leves
TagTheWeb é um experimento desenvolvido para criar um sistema de propósito geral para categorizar o conteúdo na web. É ideia dos pesquisadores brasileiros Jerry Fernades Medeiros, Bernardo Pereira Nunes, Sean Wolfgand Matsui Siqueria e Luiz André Porest Paes Leme, que demonstraram suas descobertas iniciais na European Semantic Web Conference 2018.
Eles basearam sua ferramenta de busca no esquema de categorização da Wikipedia, com o objetivo declarado de 'categorizar automaticamente qualquer conteúdo baseado em texto na Web de acordo com o conhecimento coletivo dos colaboradores da Wikipedia.'
O processo usa três etapas. Primeiro, a anotação de texto estrutura as informações de fontes não estruturadas. Em seguida, as categorias são extraídas observando os relacionamentos compartilhados por essas informações. Finalmente, eles geram uma 'impressão digital' para as categorias de tópicos principais para fácil recuperação e comparação de documentos.
O resultado é um sistema de classificação conduzido por pessoas e bom senso, a 'sabedoria da multidão', não por especialistas em domínio como o Google.
TagTheWeb ainda está em fase experimental, então vai demorar um pouco até que ele altere quaisquer paradigmas online. Se você quiser experimentar, pode encontrá-los em http://www.tagtheweb.com.br.
Admirável nova world wide web

O ex-CEO do Google, Eric Schmidt, prevê que as diferentes abordagens da liberdade de expressão nos EUA e na China podem dividir a Internet em duas. Fonte da imagem: Wikimedia Commons
Mesmo que o TagTheWeb não decole, muitas outras mudanças ocorrerão na Internet nos próximos anos. Essa é a natureza do e-besta. Aqui estão algumas das previsões mais abrangentes sobre o futuro da Internet:
Uma adolescência na internet . O Fórum Econômico Mundial prevê um endurecimento da regulamentação na internet. Ele prevê que os governos colocarão pressão sobre as plataformas para policiar seu conteúdo com mais eficiência, tomar medidas para legislar proteções de privacidade digital mais rigorosas e adotar definições mais amplas de leis antitruste para conter as práticas monopolistas do Vale do Silício.
Dividir o consenso . De acordo com um Pesquisa Pew Research , os especialistas estão divididos quanto a se a tecnologia pode conter a tendência da internet para histórias enganosas. Quarenta e nove por cento acreditam que as inovações tecnológicas ajudarão a diminuir a disseminação de mentiras, enquanto 51% acreditam que a situação não vai melhorar.
Um conto de duas internets . Ex-CEO do Google Eric Schmidt acredita que a internet vai se dividir em duas. Uma Internet será liderada pela China e a outra pelos Estados Unidos. Do Google Protótipo de libélula é supostamente um mecanismo de busca projetado para atender às rígidas práticas de censura da China. Schmidt teme que a bifurcação ocorra à medida que outros países caiam sob a influência da infraestrutura da China e adotem sua versão reprimida.
'Se você pensa na China como' Ah, sim, eles são bons com a Internet ', você está perdendo o ponto,' disse Schmidt. 'A globalização significa que eles também podem jogar.'
Alguma dessas previsões acontecerá? Quem pode dizer? A única coisa certa é que a internet está sempre em fluxo e amanhã não será como é hoje.
Compartilhar: