Espacios. Vol. 37 (Nº 07) Año 2016. Pág. 5

Estratégia de Pesquisa em Bases de Dados

Search strategy Databases

Renato NEDER 1; José Carlos MARQUES; Adriana dos Santos Caparróz CARVALHO

Recibido: 23/10/15 • Aprobado: 15/01/16


Contenido

1. Introdução

2-A Escolha pela Gestão do Conhecimento

3-A Escolha pelo Artigo Científico

4-Opções Metodológicas

5-Explicitando a Estratégia

6 Considerações

Bibliografia


RESUMO:

A produção de documentos científicos em administração e outras ciências têm crescido exponencialmente nas últimas décadas. Além disto, o desenvolvimento e posterior popularização das bases de dados de pesquisa contribuíram para a expansão do acesso a estes documentos. O problema é que devido a problemas de indexação e ao aumento da oferta de documentos, localizar conjuntos de artigos que sejam relevantes têm se tornado uma tarefa cada vez mais difícil. No intuito de tentar solucionar ou ao menos amenizar o problema este artigo propõe o desenvolvimento de uma nova estratégia de busca que seja funcional, mensurável e escalável e a aplica na área de Gestão do Conhecimento. Os resultados encontrados foram satisfatórios uma vez que a precisão e a revocação da amostra, respectivamente medidas de exatidão e abrangência, foi de respectivamente 0.769 e 0.79 o que demonstra a relevância e amplitude da consulta.
Palavras Chave: Estratégia de Pesquisa; Gestão do Conhecimento; Precisão; Revocação

ABSTRACT:

The production of scientific papers on management and other sciences have grown exponentially in recent decades. Furthermore, the development and subsequent popularity of the search databases contributed to the expansion of access to these documents. Due to problems of indexing and the increase in the supply of documents, locate sets of articles that are relevant have become an increasingly difficult task. In order to try to solve or at least alleviate the problem this paper proposes the development of a new search strategy that is functional, measurable and scalable and apply the knowledge management area. The results were satisfactory since the precision and recall of the sample, respectively measures of accuracy and completeness, was respectively 0769 and 0.79 demonstrating the relevance and breadth of consultation.
Keywords: Research Strategy; Knowledge management; Precision; Recall

1. Introdução

Qualquer que seja o método empregado, a área ou a ciência os pesquisadores têm na construção do referencial teórico um dos seus principais pilares. Desta forma, tornam-se necessárias estratégias e técnicas de pesquisa em bases de dados acadêmicas que garantam a relevância e a abrangência deste referencial, ou que ao menos permita estimar o erro das consultas em bases de dados de pesquisa com o intuito de tentar minimiza-lo.

Já nas pesquisas quantitativas bibliométricas, cientométricas ou de review, em que os documentos científicos extrapolam a função de referencial tornando-se também os objetos da pesquisa a qualidade da estratégia de busca pode ser a diferença entre a verdade cientifica e o erro.

Estratégia de busca pode ser definida segundo (Lopes, 2002) como uma técnica ou conjunto de regras que tornam possível o encontro entre uma pergunta formulada e a informação armazenada em uma base de dados. O autor argumenta que para alcançar a resposta pretendida pelo pesquisador, faz-se necessária a execução de movimentos e operações lógicas e táticas. Ora restringindo os resultados alcançados, ora ampliando-os para a obtenção de informação relevante para a pesquisa.

A pesquisa contemporânea em bases de dados se deve em parte ao trabalho Eugene Garfield, que segundo (Wormell, 1998) propôs a criação de índices de citação. Tinha com objetivo melhorar a forma como acontecia a recuperação da informação científica, além disso, esses índices permitiriam o desenvolvimento de novas alternativas para analisar artigos científicos. O que criaria mais tarde alternativas às tradicionais formas de representação baseadas na linguística e na indexação. Eugene Garfield tinha contribuído com o desenvolvimento das bases de uma nova forma de pensar e fazer a ciência que culminaria na bibliometria e na cientometria.

Continuando com a autora havia, na época, uma insatisfação com os serviços de indexação organizados a partir das disciplinas tradicionais. Nas palavras dela: "Todos eram publicados com excesso de atraso, a indexação era inconsistente e descoordenada, as políticas de seleção deixavam grandes falhas na sua cobertura." (Wormell, 1998 p. 210).

Com o avanço dos processos de indexação da informação surgiram às bases de dados de pesquisa, programas de computador que permitem aos usuários fazer consultas em grandes volumes de dados. O que ocorre é que junto com os artigos pertinentes geralmente vem uma parte que não têm relação direta com a pesquisa pretendida. No intuito de testar uma estratégia que diminuísse ou ao menos permitisse estimar esse erro, buscou-se na base de dados Web of Science artigos relacionados com Gestão do Conhecimento (GC).

2. A Escolha pela  Gestão do Conhecimento

A estratégia utilizada é escalável, ou seja, poderia ser aplicada a qualquer área do conhecimento. A escolha da área da Gestão do Conhecimento (GC) se deu devido à importância da referida área para as ciências sociais, sobretudo à administração.

No levantamento do referencial utilizado nesta pesquisa não foi encontrado nenhum artigo que trate do tema proposto na área de GC.

Além disso, a GC é uma área ampla e multidisciplinar o que garante uma quantidade relevante de artigos para esse estudo, para se ter uma ideia, quando procuramos o termo "Knowledge Management" no Google acadêmico 947.000 resultados foram encontrados. No portal de periódicos da capes o número é 30.187 registros encontrados e no Web of Science esse número chega a 15.636 registros. (Consultas feitas em 15/07/2015)

Devido à amplitude da área pode se entender a GC a partir de três noções diferentes segundo (Wiig, 1997). A primeira trata da gestão explícita do conhecimento com abordagens técnicas e se concentra principalmente no conhecimento adquirido das pessoas, em bases de conhecimento, em sistemas baseados em conhecimento, e no conhecimento disponibilizado através de redes tecnológicas. É uma noção informacional do conhecimento. A segunda noção centra-se na gestão de capital intelectual nas formas de capital estrutural e capital humano das pessoas.   A terceira noção tem foco mais amplo para incluir todos os aspectos relacionados com o conhecimento que afetam a viabilidade e o sucesso empresarial.

Para Fahay e Prusak (1998) não diferenciar conhecimento de dados e informações é um erro, pois os dados e as informações são algo fixo enquanto o conhecimento é dinâmico, os dados e as informações são externos aos indivíduos enquanto o conhecimento não pode ser separado das pessoas, dos processos do contexto, das organizações.

Nonaka (2000) ao explicar a importância do conhecimento para as organizações traz o seguinte apontamento: Se vivemos em uma sociedade e uma economia que a principal certeza é a incerteza, a principal fonte de vantagem competitiva é o conhecimento. Para o autor o domínio do conhecimento, em um contexto amplo, pode permitir as organizações dar respostas rápidas a clientes, fornecedores e parceiros, criar novos mercados, desenvolver novos produtos e dominar tecnologias emergentes.

Voltando a Wiig (1997), a gestão do conhecimento é um tema relativamente recente, mas de grande importância para a prática e consequentemente para as teorias da administração. O autor comenta ainda que organizações avançadas devem ter a capacidade de construir, transformar, organizar e usar o conhecimento.

Na mesma linha Pawlowski e Bick (2012) demonstram a importância da gestão do conhecimento na atualidade, para os autores questões recentes como dispersão geográfica, comunicação, questões culturais entraram para o escopo da GC o que se por um lado amplia a área por outro dificulta seu entendimento.

Pesquisar uma área plural, multifacetada, interdisciplinar como a GC é um desafio até para o mais experiente dos pesquisadores, a polissemia presente no termo "conhecimento" por si só já dificulta o acesso aos artigos de GC pois a maior parte das ciências, senão todas trabalham com esse conceito. Dessa forma, estratégias de busca em bases de dados que possam diminuir o erro das pesquisas em GC podem contribuir com as pesquisas da área.

3. A Escolha pelo Artigo Científico

Nesta pesquisa, foram considerados apenas artigos científicos publicados em periódicos e disponíveis na Base de Dados Web of Science, que tem provável relação com a gestão do conhecimento.

A respeito dos artigos científicos, Carey (2014) propõe que à medida que a retórica do discurso científico evoluiu ao longo do tempo, um formato altamente estável surgiu como estrutura predominante para a divulgação de estudos científicos, os periódicos e os artigos científicos. Tendência que perdura até a atualidade.

Continuando com Carey (2014) o aparecimento dos periódicos ajudou a mudar a cultura científica, já que estas publicações exibiam em forma impressa o internacionalismo, a civilidade, procedimentos rigorosos de avaliação por pares, os ideais de objetividade e cientificidade, características da comunidade científica, do Iluminismo à Pós Modernidade.

A necessidade de demonstrar os progressos científicos incentivou o surgimento de periódicos e ajudou a criar um clima em que nenhum trabalho fora considerado verdadeiramente completo até que os resultados fossem referendados e publicados, isto é, partilhados (Carey, 2014).

Na modernidade, os textos científicos, principalmente os artigos, permitiram dinamizar alguns processos, sobretudo, no que tange à comunicação e socialização de dados, métodos, referenciais etc. Na pós-modernidade as técnicas e tecnologias contemporâneas podem permitir a recuperação eficaz e posterior utilização de um grande volume de informação, para tanto é necessário que se estruturem os caminhos, as opções metodológicas e as estratégias que irão balizar as consultas em bases de dados de artigos científicos.

4. Opções Metodológicas

A coleção de dados utilizada nesta pesquisa é provida por fontes eletrônicas. Para Borgatti e Foster (2003) existe um incontável número de dados que pode ser minerado em fontes eletrônicas como; E-mail, sites de redes sociais, bancos de dados de filmes, livros, páginas da web, além, é claro, dos bancos de dados de artigos científicos.

A quantidade de produção cientifica encontrada nas bases de dados, exemplificado no item 2, segundo parágrafo, deixa complexa a procura por informações relevantes. Desta forma faz-se necessário que se pensem estratégias que podem servir como balizadoras da pesquisa. Wormell (1998), propõe então que é necessário aprender a explorar bases de dados on-line não somente para ter acesso a documentos ou a fatos, mas também para traçar as tendências para o desenvolvimento da sociedade, das disciplinas científicas e das áreas de produção e consumo.

Nas palavras do autor: "Esse tipo de informação encontrado em bases de dados, entretanto, é visível somente para o pesquisador perspicaz e para aqueles que aprenderam a "ler nas entrelinhas" da informação eletrônica." (Wormell, 1998, p. 210)

Já Innocentini, Bessi, e Milanez (2014) propõem que entre as variáveis que mais influenciam a qualidade das pesquisas, a estratégia de busca empregada na recuperação do conjunto de dados é fundamental. Para eles uma amostra ideal deve ser ampla o suficiente para descrever o assunto de interesse e, ao mesmo tempo, conter o mínimo de registros irrelevantes, que teriam o poder de distorcer a análise final.

Gagnon et al. (2012); Nyqvist, Forsman, Giuntoli, e Cattan (2013); Seale e Millar, (2014); Slade et al. (2015) corroboram com a importância de se ter estratégias de busca para acessar bancos de dados de pesquisas cientificas.

Como apresentado, é cada vez mais necessário que os pesquisadores tenham estratégias bem delineadas que permitam que os mesmos acessem informações relevantes e concisas. Para tanto propõe-se os seguintes passos:

1- Estabelecer um glossário de termos chave com base na literatura da área pesquisada: No caso em questão utilizou-se como documento central o Hankbook de Gestão do Conhecimento de Clyde W. Holssaple (2003), o Handbook de Aprendizagem Organizacional e de Gestão do Conhecimento de Mark Easterby-Smith e da Marjorie A. Lyles (2011) além dos seguintes artigos: Alavi e Leidner (2001); Authors (2014); Garlattir (2015); Lee e Chen (2012); Liao (2003); Mariano e Walter (2015); Martensson (2000); Nonaka (2000); Wiig (1997) . A partir desta leitura forma encontrados 55 termos que têm relação direta com a área de Gestão do conhecimento.

Porter et al. (2008) estabelecem três critérios fundamentais para a inclusão de termos de pesquisa, para eles os mesmos devem ser: (1) Associados com uma quantidade considerável de artigos enquanto ao mesmo tempo são relevantes para o domínio (2) Os pesquisadores devem ser capazes de determinar o quão bem um tema de interesse é coberto pela pesquisa; e (3) Elástico deve ser fácil para adicionar / remover / modificar termos de uma pesquisa no intuito de atender diferentes interesses de pesquisa. Quanto a este último ponto, os autores sugerem que pode-se acompanhar o surgimento de novos termos ao longo do tempo e ajustar os algoritmos de busca dinamicamente.

Com os termos estabelecidos fazer a consulta de cada termo no intuito de estabelecer os 25 que mais retornaram registros, pois a consulta da base Web of Science só permite estabelecer 25 restrições.

2-    Testar cada termo individualmente: Foi calculada uma estimativa da quantidade de artigos pertinentes (precisão) para cada termo a partir da leitura do resumo e do título de uma amostra de 5% dos arquivos recuperados.

Innocentini et al. (2014) apontam que a precisão pode ser medida pela equação 1:

Equação 1. Precisão

Nota. Fonte: (Innocentini et al., 2014)

 Se a precisão era maior que 70% essa consulta foi incluída na pesquisa senão incluía-se uma nova restrição, trazendo apenas artigos da área de management and business. Calcula-se novamente a quantidade de artigos pertinentes, se o resultado é maior que 70% incorporava-se o termo a pesquisa, senão descartava-se o termo.

3- Calcular a precisão e a revocação da estratégia: Essas medidas permitem aos pesquisadores compreender a exatidão e a abrangência da pesquisa (Innocentini et al., 2014) trazem que a (revocação) pode ser medida pela equação 2:

Equação 2. Revocação

Nota. Fonte: (Innocentini et al., 2014)

O desafio de utilizar a equação 2 em bases de artigos científicos é que nunca se sabe ao certo quantas referencias relevantes existem no sistema, para tanto foi desenvolvida uma estratégia que buscou estimar esse indicador (ver item 5.3).

5. Explicitando a Estratégia

Como exposto anteriormente a estratégia de consulta se deu em três partes: 1- A busca pelos termos chave. 2- testando a relevância destes termos. 3 - Calculando os coeficientes da estratégia.

5.1 A busca pelos termos chave

Ao optar por utilizar um handbook como fonte para encontrar os termos chaves da área de GC, alguns fatores foram levados em consideração. O primeiro é o tempo, pois dessa maneira a pesquisa por artigos importantes na área já foi feita pelo organizador do handbook o que poupou um esforço considerável de leitura e triagem.

 O segundo é o custo, pois uma abordagem utilizando especialistas da área seria cara e demorada o que provavelmente inviabilizaria a pesquisa.

Em terceiro a escalabilidade, pois desta forma a estratégia encontrada pode ser facilmente replicada na mesma área ou em outras.

A consulta inicial de termos chave trouxe os resultados apresentados na Quadro 1:

Quadro 1: Termos Escolhidos

                                                 Termos Chave

Knowledge management

"Knowledge Transfer*"

"Tacit Knowledge"

"Explicit Knowledge"

"Knowledge work*"

"Knowledge Economy"

"Manage* Knowledge"

"acquire Knowledge"

"Intellectual capital"

"Generat* Knowledge"

"Transfer* Knowledge"

"Knowledge resources"

"Creat* Knowledge"

"Knowledge Needs"

"Extracting Knowledge"

"Knowledge application"

"Knowledge-based view"

"Store*  Knowledge"

"Knowledge Assets"

"Knowledge share*"

"Knowledge Repository"

"Knowledge capture"

"Combine Knowledge"

"Knowledge repositories"

"Knowledge Culture"

Fonte: Dados da pesquisa (2015)
Nota: Fonte: (Alavi & Leidner, 2001; Authors, 2014; Garlattir, 2015; Holsapple, 2003; Lee & Chen, 2012; Liao, 2003; Mariano & Walter, 2015; Martensson, 2000; Nonaka, 2000; Wiig, 1997b; Easterby-smith & Lyles, 2011) 25 termos escolhidos por retornarem mais registros: Autor

Dos 55 termos chave encontrado selecionou-se os 25 que trouxeram o maior número de registros. A quantidade de 25 termos se justifica pela restrição de consulta da Web of Science que permite apenas 25 termos. Com os termos escolhidos foi realizada uma consulta do primeiro termo "Knowledge Management" sem restrições e em seguida foram feitas as consultas de cada termo separadamente restringindo os outros 24. Por exemplo: "Knowledge Transfer*" not Knowledge management not "Tacit Knowledge"… Essa restrição é importante para que as consultas não retornem registros repetidos.

5.2 Testando a relevância dos termos

Para testar a quantidade de artigos de cada termo que possivelmente eram de GC, foi escolhida a seguinte estratégia: Foram lidos os títulos e os resumos de 5% do total de artigos recuperados para cada termo, quando esse número era menor que 10 lia-se o título e o resumo de 10 artigos. Desta forma foi estimada a quantidade de artigos que provavelmente tem relação com GC, se a porcentagem de artigos de GC encontrada fosse maior que 70% os dados da consulta daquele termo eram agregados à estratégia, senão era feita uma nova restrição buscando apenas os artigos que pertencessem as áreas de management and busines. O resultado era novamente testado e se o resultado fosse maior que 70 a restrição era agregada a consulta, senão o termo era descartado.

5.3 Calculando os coeficientes da estratégia.

Como foi apresentado na metodologia o problema de aplicar o coeficiente de revocação ao universo de artigos científicos presentes em bases de dados de pesquisa é que é necessário saber previamente a quantidade de referências relevantes existentes no sistema (RRES). Como esse é um número que só é possível saber ao certo lendo o texto completo de todos os artigos presentes na base. Optou-se por estimar o indicador da forma demonstrada no quadro 2:

Desta forma para calcular o RRES foram somados os 25 valores da coluna RERE (referências relevantes estimadas) como evidenciado na Tabela 1.

Tabela 1
Memória de Calculo da Estratégia de Busca

Fonte: dados da pesquisa 2015 Nota. Coluna KM são os artigos de knowledge management,
coluna NKM são os artigos que não são de knowledge management,
coluna RERE são as referências relevantes estimadas na consulta.: Autor      
                

6. Considerações

A estratégia de busca se mostrou eficiente para o universo pesquisado. Graças à sua escalabilidade também pode ser utilizada como modelo para pesquisas em outras áreas e em outras ciências.

Conforme pode-se constatar na análise da tabela 2 o RRES foi estimado em  6757,52  desta forma a precisão e a revocação da consulta está  apresentada no Quadro 2:

Quadro 2: Coeficientes de Precisão e Revocação

Coeficientes

RRES

6757.72

total doc recuperado

6973

Total doc relevante recuperado

5368.06

Revocação

0.794358863

Precisão

0.769834459

Fonte: dados da pesquisa (2015)
Nota. Coeficientes encontrados nas análises: Autor

Quando compara-se os dados encontrados pela estratégia com os resultados da primeira consulta que agregava os 25 termos com mais registros foram encontrados 14.148,3 documentos com  uma precisão de apenas 0.37, a revocação foi de 0.79.

Quando compara-se a estratégia proposta com o resultado da consulta "Knowledge management" (precisão 0.77 e revocação 0.74).  Neste caso, a revocação, ou seja, a abrangência da estratégia foi melhor pois aumentamos o universo pesquisado e a precisão permaneceu quase inalterada. Além disso, o cálculo da revocação não seria possível sem a implementação da estratégia o que por si só já a justifica.

Por fim, fica claro que a implementação e a implantação de estratégias de pesquisa em bases de dados são um fator importante, sobretudo, quando se trata de pesquisas que necessitam abordar grande número de documentos científicos, garantindo sua abrangência e precisão.         

Exclusivamente a respeito da gestão do conhecimento, os resultados desta pesquisa podem servir como um importante instrumento que permita garantir a relevância de pesquisas em bancos de dados da área e que facilite assim o trabalho dos pesquisadores.

Bibliografia

Alavi, M., & Leidner, D. E. (2001). Knowledge management and knowledge management systems: Conceptual foundations and research issues. MIS Quarterly.

Authors, F. (2014). Outsourcing of knowledge processes : A literature review.

Borgatti, S. P., & Foster, P. C. (2003). Journal of Management.

Carey, J. (2014). Scientific Communication Before and After Networked Science Scientific Communication Before and After ­ Networked Science.

Easterby-smith, M., & Lyles, M. A. (2011). Hankbook of Organizational Learning & Knowledge Management.

Fahay, L., & Prusak, L. (1998). Fahay&Prusak1998.11deadliest sins of knowledge management.pdf.

Gagnon, M.-P., Desmartis, M., Labrecque, M., Car, J., Pagliari, C., Pluye, P., … Légaré, F. (2012). Systematic Review of Factors Influencing the Adoption of Information and Communication Technologies by Healthcare Professionals. Journal of Medical Systems.

Garlattir, M. M. J. D. A. (2015). Public sector knowledge management : A structured literature review.

Holsapple, C. W. (2003). Handbook on Knowledge Management 1 Knowledge Matters (1st ed.). Springer-Verlag Berlin.

Innocentini, L. L. de F., Bessi, N. C., & Milanez, D. H. (2014). De Documentos De Patentes Relacionados À Introdução Indicadores de ciência e tecnologia ( C & T ) têm sido recorrentemente utilizados como forma de sintetizar , mensurar e avaliar a dinâmica de pesquisas científicas e desenvolvimentos tecnológicos , que s.

Lee, M. R., & Chen, T. T. (2012). Revealing research themes and trends in knowledge management: From 1995 to 2010. Knowledge-Based Systems.

Liao, S. (2003). Knowledge management technologies and applications—literature review from 1995 to 2002. Expert Systems with Applications.

Lopes, I. L. (2002). Uso das linguagens controlada e natural em bases de dados: revisão da literatura. Ciência Da Informação.

Mariano, S., & Walter, C. (2015). The construct of absorptive capacity in knowledge management and intellectual capital research: content and text analyses. Journal of Knowledge Management.

Martensson, M. (2000). A critical review of knowledge management as a management tool. Journal of Knowledge Management.

Nonaka, I. (2000). The Knowledge-Creating Company.

Nyqvist, F., Forsman, A. K., Giuntoli, G., & Cattan, M. (2013). Social capital as a resource for mental well-being in older people: a systematic review. Aging & Mental Health.

Pawlowski, J., & Bick, M. (2012). The Global Knowledge Management Framework : Towards a Theory for Knowledge Management in Globally Distributed Settings Business Information Systems , ESCP Europe Berlin , Germany.

Porter, A. L., Youtie, J., Shapira, P., & Schoeneck, D. J. (2008). Refining search terms for nanotechnology. Journal of Nanoparticle Research.

Seale, J., & Millar, M. (2014). Perinatal vertical transmission of antibiotic-resistant bacteria: A systematic review and proposed research strategy. BJOG: An International Journal of Obstetrics and Gynaecology.

Slade, S. C., Kent, P., Bucknall, T., Molloy, E., Patel, S., & Buchbinder, R. (2015). Barriers to primary care clinician adherence to clinical guidelines for the management of low back pain: protocol of a systematic review and meta-synthesis of qualitative studies. BMJ Open.

Wiig, K. M. (1997a). Knowledge Management : An Introduction and Perspective.

Wiig, K. M. (1997b). Knowledge Management : Where Did It Come From and Where Will It Go ?.

Wormell, I. (1998). Informetria: explorando bases de dados como instrumentos de análise. Ciência da Informação.


1. Email: renatoneder@hotmail.com



Vol. 37 (Nº 07) Año 2016

[Índice]

[En caso de encontrar algún error en este website favor enviar email a webmaster]