Eu tenho dirigido o mecanismo de busca clínica Trip Database desde há quase vinte anos e, à medida que ele tem evoluido, surgiram oportunidades para trabalhar com outros setores ou indivíduos com perspectivas diferentes. Recentemente, isso envolveu o mundo da recuperação de informações acadêmicas: uma conversa casual com acadêmicos da Universidade de Glasgow mudou a maneira como eu olhei para a pesquisa. Uma noção realmente importante que aprendi foi sobre os dados do fluxo de cliques – os sites de dados coletam a interação do usuário com o site. No caso do Trip, esses dados equivalem aos termos de pesquisa usados e aos artigos nos quais os usuários clicam.

Uma coisa é certa, o Trip tem muito disso. Com um milhão de pesquisas por mês (a grande maioria sendo de profissionais de saúde) acumulamos centenas de milhões de pontos de dados nos anos desde que começamos a coletá-los. Isso se qualifica como big data. Como em todos os projetos de big data, o truque parece ser dar sentido a tudo isso e é uma jornada que acho que acabamos de começar.

Vamos ver o exemplo onde um usuário pesquisa por “acne e minociclina”; podemos inferir que o usuário estava interessado na eficácia da minociclina no tratamento da acne. O usuário pode então clicar na revisão sistemática Cochrane “Minociclina para acne vulgar: eficácia e segurança”, o que pode reforçar qualquer inferência. Isoladamente, eles podem ter um valor muito limitado, mas agregam o comportamento de busca de centenas de milhares de pessoas e os resultados revelarão padrões de comportamento que oferecem uma percepção das incertezas dos médicos. Se víssemos apenas uma única busca por “minociclina e acne”, poderíamos concluir que era de interesse limitado para os profissionais de saúde, talvez apenas uma pesquisa aleatória. Mas se fosse pesquisado cem vezes em um mês – provavelmente sugeriria uma área de interesse e incerteza significativas.

O Trip tem captado os dados de uso (também conhecidos como dados de fluxo de cliques) desde 2010 e acumulou centenas de milhões de pontos de dados. Mas serão os dados úteis? A primeira grande análise que o Trip realizou sobre os nossos dados foi mapear os artigos que os usuários analisaram na mesma sessão de pesquisa. A imagem abaixo mostra um exemplo:

Na imagem, selecionamos pesquisas para infecção do trato urinário e mapeamos as conexões (conexões feitas quando os usuários clicam no mesmo artigo na mesma sessão – o usuário os vincula com base na intenção deles). Como se pode ver, os artigos formam conjuntos de tópicos distintos. No canto inferior esquerdo, há um conjunto claro de artigos sobre ITU e oxicoco. Parece razoável sugerir que esses 19 artigos formam os principais artigos sobre o tema; todos selecionados por usuários do Trip. Igualmente interessantes seriam aqueles em que nunca clicaram; então, que artigos não interessaram aos nossos usuários? Como o “impacto” se torna um conceito cada vez mais importante, ter artigos para os quais as pessoas não olham deve ser tão interessante quanto os que são clicados.

Mais recentemente, o nosso percurso/análise foi impulsionado pelo nosso trabalho com a Technical University of Vienna (TUW), como parte do projeto KConnect financiado pelo Horizon 2020. As ferramentas que a TUW nos deu nos permitiram entender melhor os dados. Embora um teste no Twitter possa parecer um uso superficial dos dados, ele provou ser elucidativo. O primeiro questionário perguntou qual a condição de pele os usuários buscam mais, dadas as opções de acne, eczema e psoríase. Mais de metade pensava que a pesquisa mais popular era a acne, quando na realidade era psoríase. Da mesma forma, quando perguntamos quais eram os mais procurados entre gripe (influenza), sarampo, Zika e malária, a maioria dos usuários (80%) disse Zika, quando na verdade era gripe (influenza). Embora os números sejam relativamente pequenos, isso mostra que não é fácil adivinhar onde estão as incertezas. Assim, a análise baseada em dados (baseada em evidências) parece ser uma ferramenta útil para revelar incertezas clínicas

Os dados podem ser analisados para mostrar que, quando as pessoas pesquisam gripe (influenza), na maioria das vezes também procuram oseltamivir e a vacina contra a gripe (influenza). Para o Zika foi vacina, embriopatia e imagiologia!

Os dados ainda nos permitem explorar áreas de tópicos para procurar padrões e uma amostra recente de 4 semanas de dados revela que o autismo é o tópico mais popularmente procurado na área de saúde infantil:

Os dados podem ser examinados semanalmente, quer seja em termos de pesquisa ou artigos visualizados. Isso permite ver tendências de tópicos. Algo pode ter sido uma fonte de grande incerteza, mas novas evidências ou orientações posteriores podem dar a certeza que os profissionais de saúde precisam e, portanto, reduzir a necessidade de buscar respostas. Mostramos, por exemplo, tendências semelhantes, conforme mostrado pelo serviço Google Flu Trends – em que o número de consultas que recebemos corresponde rigorosamente à incidência relatada de gripe (influenza).

Nosso interesse inicial era curiosidade, a maneira como nossos usuários interagem com o site mostra alguma coisa útil? Nós achamos que é definitivamente interessante e potencialmente útil. Por exemplo, já estamos discutindo o uso desses dados com um grande financiador de pesquisa para ajudar na priorização de novas pesquisas. Enquanto nenhum dos lados acha que vá dar uma resposta definitiva, é provavelmente outra peça do quebra-cabeças para entender as incertezas. Como tal, complementará os sistemas que requerem trabalho mais intensivo que são usados atualmente.

Autor: Jon Brassey

Jon Brassey é o fundador e diretor do mecanismo de busca MBE, Trip Database. Além disso, ele trabalha como líder em mobilização de conhecimento em Public Health Wales, é membro honorário do Centro de Medicina Baseada em Evidências, em Oxford. A análise de fluxo de cliques é uma área em desenvolvimento para o Trip e, no futuro, poderá ter algum interesse comercial.

Leia mais