Pesquisa | Portal Regional da BVS

Analysis of the Formation of Scientific Communities in the Journal Research and Education in Nursing (2010 - 2020) and its Disciplinary Influence: an Approach from Bibliometric Analysis, Network Analysis, and Natural Language Processing / Análisis de la formación de comunidades científicas en la revista Investigación y Educación en Enfermería(2010-2020) y su influencia disciplinar: Un enfoque desde el análisis bibliométrico, análisis de redes y procesamiento de lenguaje natural / Análise da formação de comunidades científicas na revista Nursing Research and Education (2010-2020) e sua influência disciplinar: Uma abordagem a partir da análise bibliométrica, análise de redes e processamento de linguagem natural

Guzmán Henao, Andrés.

Invest. educ. enferm ; 42(2): 163-178, 20240722. ilus, tab, graf

Artigo em Inglês | LILACS, BDENF - Enfermagem, COLNAL | ID: biblio-1570366

RESUMO

Objectives. This work sought to identify the academic communities that have shown interest and participation in the Journal Research and Education in Nursing and analyze the scientific impact generated by said journal. Methods. A bibliometric analysis was carried out, as well as social network analysis and techniques of natural language processing to conduct the research. The data was gathered and analyzed during a specific study period, covering from 2010 - 2020, for articles published in the journal, and 2010 - 2022, for articles that cited the journal within Scopus. These methods permitted performing an exhaustive evaluation of the journal's influence and reach in diverse academic and geographic contexts. Results. During the analysis, it was noted that the journal Research and Education in Nursing has had significant influence in academic and scientific communities, both nationally and internationally. Collaboration networks were detected among diverse institutions and countries, which indicates active interaction in the field of nursing research. In addition, trends and emerging patterns were identified in this field, providing a more complete view of the discipline's evolution. Conclusion. Based on the results obtained, it is concluded that the journal Research and Education in Nursing has played un fundamental role in disseminating knowledge and promoting research in nursing. The combination of Bibliometric metrics, social network analysis, and natural language processing permitted utmost comprehension of its impact in the scientific and academic community globally.

Objetivos. Identificar las comunidades académicas que han mostrado interés y participación en la revista Investigación y Educación en Enfermería y analizar el impacto científico generado por esta publicación. Métodos. Se realizó un análisis bibliométrico, así como análisis de redes sociales y técnicas de procesamiento de lenguaje natural para llevar a cabo la investigación. Los datos se recopilaron y analizaron durante un período de estudio específico, abarcando los años 2010-2020, para los artículos publicados en la revista, y 2010-2022, para los artículos que citaron la revista dentro de Scopus. Estos métodos permitieron realizar una evaluación exhaustiva de la influencia y alcance de la revista en diversos contextos académicos y geográficos. Resultados. Durante el análisis, se observó que la revista Investigación y Educación en Enfermería ha ejercido una influencia significativa en las comunidades académicas y científicas, tanto a nivel nacional como internacional. Se detectaron redes de colaboración entre diversas instituciones y países, lo que indica una interacción activa en el ámbito de la investigación en enfermería. Además, se identificaron tendencias y patrones emergentes en este campo, proporcionando una visión más completa de la evolución de la disciplina. Conclusión. Basándose en los resultados obtenidos, se concluye que la revista Investigación y Educación en Enfermería ha desempeñado un papel fundamental en la difusión del conocimiento y la promoción de la investigación en enfermería. La combinación de métricas bibliométricas, análisis de redes sociales y procesamiento de lenguaje natural permitió una comprensión más completa de su impacto en la comunidad científica y académica a nivel global.

Objetivos. Identificar as comunidades acadêmicas que demonstraram interesse e participação na revista Nursing Research and Education e analisar o impacto científico gerado por esta publicação colombiana. Métodos. Foi realizada análise bibliométrica, análise de redes sociais e técnicas de processamento de linguagem natural para a realização da pesquisa. Os dados foram coletados e analisados durante um período específico de estudo, abrangendo os anos 2010-2020, para artigos publicados na revista, e 2010-2022, para artigos que citaram a revista dentro do Scopus. Esses métodos permitiram uma avaliação abrangente da influência e do alcance da revista em diversos contextos acadêmicos e geográficos. Resultados. Durante a análise, observou-se que a revista Nursing Research and Education tem exercido influência significativa nas comunidades acadêmica e científica, tanto nacional quanto internacionalmente. Foram detectadas redes de colaboração entre diversas instituições e países, o que indica interação ativa no campo da pesquisa em enfermagem. Além disso, foram identificadas tendências e padrões emergentes neste campo, proporcionando uma visão mais completa da evolução da disciplina. Conclusão. Com base nos resultados obtidos, conclui-se que a revista Nursing Research and Education tem desempenhado um papel fundamental na divulgação do conhecimento e na promoção da investigação em enfermagem. A combinação de métricas bibliométricas, análise de redes sociais e processamento de linguagem natural permitiu uma compreensão mais completa do seu impacto na comunidade científica e académica global.

Assuntos

Humanos , Masculino , Feminino , Pesquisa , Educação , Análise de Rede Social , Processamento de Linguagem Natural

Natural language processing in the classification of radiology reports in benign gallbladder diseases / O processamento de língua natural permite a classificação correta de laudos radiológicos em doenças benignas da vesícula biliar

Santin, Lislie Gabriela; Lee, Henrique Min Ho; Silva, Viviane Mariano da; Cardoso, Ellison Fernando; Gazzola, Murilo Gleyson.

Radiol. bras ; Radiol. bras;57: e20230096en, 2024. tab, graf

Artigo em Inglês | LILACS-Express | LILACS | ID: biblio-1564998

RESUMO

Abstract Objective: To develop a natural language processing application capable of automatically identifying benign gallbladder diseases that require surgery, from radiology reports. Materials and Methods: We developed a text classifier to classify reports as describing benign diseases of the gallbladder that do or do not require surgery. We randomly selected 1,200 reports describing the gallbladder from our database, including different modalities. Four radiologists classified the reports as describing benign disease that should or should not be treated surgically. Two deep learning architectures were trained for classification: a convolutional neural network (CNN) and a bidirectional long short-term memory (BiLSTM) network. In order to represent words in vector form, the models included a Word2Vec representation, with dimensions of 300 or 1,000. The models were trained and evaluated by dividing the dataset into training, validation, and subsets (80/10/10). Results: The CNN and BiLSTM performed well in both dimensional spaces. For the 300- and 1,000-dimensional spaces, respectively, the F1-scores were 0.95945 and 0.95302 for the CNN model, compared with 0.96732 and 0.96732 for the BiLSTM model. Conclusion: Our models achieved high performance, regardless of the architecture and dimensional space employed.

Resumo Objetivo: Desenvolver uma aplicação de processamento de linguagem natural capaz de identificar automaticamente doenças cirúrgicas benignas da vesícula biliar a partir de laudos radiológicos. Materiais e Métodos: Desenvolvemos um classificador de texto para classificar laudos como contendo ou não doenças cirúrgicas benignas da vesícula biliar. Selecionamos aleatoriamente 1.200 laudos com descrição da vesícula biliar de nosso banco de dados, incluindo diferentes modalidades. Quatro radiologistas classificaram os laudos como doença benigna cirúrgica ou não. Duas arquiteturas de aprendizagem profunda foram treinadas para a classificação: a rede neural convolucional (convolutional neural network - CNN) e a memória longa de curto prazo bidirecional (bidirectional long short-term memory - BiLSTM). Para representar palavras de forma vetorial, os modelos incluíram uma representação Word2Vec, com dimensões variando de 300 a 1000. Os modelos foram treinados e avaliados por meio da divisão do conjunto de dados entre treinamento, validação e teste (80/10/10). Resultados: CNN e BiLSTM tiveram bom desempenho em ambos os espaços dimensionais. Relatamos para 300 e 1000 dimensões, respectivamente, as pontuações F1 de 0,95945 e 0,95302 para o modelo CNN e de 0,96732 e 0,96732 para a BiLSTM. Conclusão: Nossos modelos alcançaram alto desempenho, independentemente de diferentes arquiteturas e espaços dimensionais.

Processamento de linguagem natural não supervisionado na identificação de pacientes suspeitos de infecção por COVID-19 / Procesamiento del lenguaje natural no supervisado para identificar a los pacientes sospechosos de infección por COVID-19 / Unsupervised natural language processing in the identification of patients with suspected COVID-19 infection

Silva, Rildo Pinto da; Pollettini, Juliana Tarossi; Pazin Filho, Antonio.

Cad. Saúde Pública (Online) ; 39(11): e00243722, 2023. tab, graf

Artigo em Português | LILACS-Express | LILACS | ID: biblio-1550174

RESUMO

Os pacientes com síndrome pós-COVID-19 se beneficiam de programas de promoção de saúde e sua rápida identificação é importante para a utilização custo efetiva desses programas. Técnicas tradicionais de identificação têm fraco desempenho, especialmente em pandemias. Portanto, foi realizado um estudo observacional descritivo utilizando 105.008 autorizações prévias pagas por operadora privada de saúde com aplicação de método não supervisionado de processamento de linguagem natural por modelagem de tópicos para identificação de pacientes suspeitos de infecção por COVID-19. Foram gerados seis modelos: três utilizando o algoritmo BERTopic e três modelos Word2Vec. O modelo BERTopic cria automaticamente grupos de doenças. Já no modelo Word2Vec, para definição dos tópicos relacionados a COVID-19, foi necessária análise manual dos 100 primeiros casos de cada tópico. O modelo BERTopic com mais de 1.000 autorizações por tópico sem tratamento de palavras selecionou pacientes mais graves - custo médio por autorizações prévias pagas de BRL 10.206 e gasto total de BRL 20,3 milhões (5,4%) em 1.987 autorizações prévias (1,9%). Teve 70% de acerto comparado à análise humana e 20% de casos com potencial interesse, todos passíveis de análise para inclusão em programa de promoção à saúde. Teve perda importante de casos quando comparado ao modelo tradicional de pesquisa com linguagem estruturada e identificou outros grupos de doenças - ortopédicas, mentais e câncer. O modelo BERTopic serviu como método exploratório a ser utilizado na rotulagem de casos e posterior aplicação em modelos supervisionados. A identificação automática de outras doenças levanta questionamentos éticos sobre o tratamento de informações em saúde por aprendizado de máquina.

Los pacientes con síndrome pos-COVID-19 pueden beneficiarse de los programas de promoción de la salud. Su rápida identificación es importante para el uso efectivo de estos programas. Las técnicas de identificación tradicionales no tienen un buen desempeño, especialmente en pandemias. Se realizó un estudio observacional descriptivo, con el uso de 105.008 autorizaciones previas pagadas por un operador de salud privado mediante la aplicación de un método no supervisado de procesamiento del lenguaje natural mediante modelado temático para identificar a los pacientes sospechosos de estar infectados por COVID-19. Se generaron 6 modelos: 3 con el uso del algoritmo BERTopic y 3 modelos Word2Vec. El modelo BERTopic crea automáticamente grupos de enfermedades. En el modelo Word2Vec para definir temas relacionados con la COVID-19, fue necesario el análisis manual de los primeros 100 casos de cada tema. El modelo BERTopic con más de 1.000 autorizaciones por tema sin tratamiento de palabras seleccionó a pacientes más graves: costo promedio por autorizaciones previas pagada de BRL 10.206 y gasto total de BRL 20,3 millones (5,4%) en 1.987 autorizaciones previas (1,9%). Además, contó con el 70% de aciertos en comparación con el análisis humano y el 20% de los casos con potencial interés, todos los cuales pueden analizarse para su inclusión en un programa de promoción de la salud. Hubo una pérdida significativa de casos en comparación con el modelo tradicional de investigación con lenguaje estructurado y se identificó otros grupos de enfermedades: ortopédicas, mentales y cáncer. El modelo BERTopic sirvió como un método exploratorio para ser utilizado en el etiquetado de casos y su posterior aplicación en modelos supervisados. La identificación automática de otras enfermedades plantea preguntas éticas sobre el tratamiento de la información de salud mediante el aprendizaje de máquina.

Patients with post-COVID-19 syndrome benefit from health promotion programs. Their rapid identification is important for the cost-effective use of these programs. Traditional identification techniques perform poorly especially in pandemics. A descriptive observational study was carried out using 105,008 prior authorizations paid by a private health care provider with the application of an unsupervised natural language processing method by topic modeling to identify patients suspected of being infected by COVID-19. A total of 6 models were generated: 3 using the BERTopic algorithm and 3 Word2Vec models. The BERTopic model automatically creates disease groups. In the Word2Vec model, manual analysis of the first 100 cases of each topic was necessary to define the topics related to COVID-19. The BERTopic model with more than 1,000 authorizations per topic without word treatment selected more severe patients - average cost per prior authorizations paid of BRL 10,206 and total expenditure of BRL 20.3 million (5.4%) in 1,987 prior authorizations (1.9%). It had 70% accuracy compared to human analysis and 20% of cases with potential interest, all subject to analysis for inclusion in a health promotion program. It had an important loss of cases when compared to the traditional research model with structured language and identified other groups of diseases - orthopedic, mental and cancer. The BERTopic model served as an exploratory method to be used in case labeling and subsequent application in supervised models. The automatic identification of other diseases raises ethical questions about the treatment of health information by machine learning.

Virtual assistant: a tool for health co-production in coping with covid-19 / Asistente virtual: una herramienta para co-producción en salud con el fin de hacer frente al covid-19 / Assistente virtual: ferramenta para coprodução em saúde no enfrentamento à covid-19

Fabrizzio, Greici Capellari; Oliveira, Lincoln Moura de; Costa, Diovane Ghignatti da; Erdmann, Alacoque Lorenzini; Santos, José Luís Guedes dos.

Texto & contexto enferm ; 32: e20220136, 2023. graf

Artigo em Inglês | LILACS-Express | LILACS, BDENF - Enfermagem | ID: biblio-1432481

RESUMO

ABSTRACT Objective: to describe the development of a virtual assistant as a potential tool for health co-production in coping with COVID-19. Method: this is an applied technological production research study developed in March and April 2020 in five stages: 1) literature review, 2) content definition, 3) elaboration of the dialog, 4) test of the prototype, and 5) integration with the social media page. Results: the literature review gathered diverse scientific evidence about the disease based on the Brazilian Ministry of Health publications and by consulting scientific articles. The content was built from the questions most asked by the population, in March 2020, evidenced by Google Trends, in which the following topics emerged: concept of the disease, prevention means, transmission of the disease, main symptoms, treatment modalities, and doubts. Elaboration of the dialog was based on Natural Language Processing, intentions, entities and dialog structure. The prototype was tested in a laboratory with a small number of user computers on a local network to verify the functionality of the set of apps, technical and visual errors in the dialog, and whether the answers provided were in accordance with the user's question, answering the questions correctly and integrated into Facebook. Conclusion: the virtual assistant proved to be a health education tool with potential to combat "Fake News". It also represents a patient-centered form of health communication that favors the strengthening of the bond and interaction between health professionals and patients, promoting co-production in health.

RESUMEN Objetivo: describir el desarrollo de un asistente virtual como posible herramienta para la co-producción en salud a fin de hacer frente al COVID-19. Método: trabajo de investigación aplicado de producción tecnológica, desarrollado en marzo y abril de 2020 en cinco etapas: 1) revisión de la literatura, 2) definición del contenido, 3) elaboración del diálogo, 4) prueba del prototipo y 5) integración con la página web del medio social. Resultados: en la revisión de la literatura se reunieron evidencias científicas sobre la enfermedad a partir de las publicaciones del Ministerio de Salud de Brasil, al igual que sobre la base de consultas en artículos científicos. El contenido se elaboró a partir de las preguntas más frecuentes de la población, en marzo de 2020, puestas en evidencia por medio de Google Trends, donde surgieron los siguientes temas: concepto de la enfermedad, formas de prevención, transmisión de la enfermedad, principales síntomas, modalidades de tratamiento y dudas. La elaboración del diálogo se basó en el Procesamiento de Lenguaje Natural, en intenciones, en entidades y en la estructura del diálogo. El prototipo se puso a prueba en un laboratorio con una cantidad reducida de computadoras usuario en una red local para verificar la funcionalidad del conjunto de aplicaciones, errores técnicos y visuales acerca del diálogo, y si las respuestas proporcionadas estaban de acuerdo con la pregunta del usuario, respondiendo correctamente los interrogantes e integrado a Facebook. Conclusión: el asistente virtual demostró ser una herramienta de educación en salud con potencial para combatir Fake News. También representa una forma de comunicación en salud centrada en el paciente que favorece el fortalecimiento del vínculo y la interacción entre profesionales de la salud y pacientes, promoviendo así la coproducción en salud.

RESUMO Objetivo: descrever o desenvolvimento de um assistente virtual como ferramenta potencial para a coprodução em saúde no enfrentamento à COVID-19. Método: trata-se de uma pesquisa aplicada de produção tecnológica, desenvolvida nos meses de março e abril de 2020 em cinco etapas: 1) revisão de literatura, 2) definição de conteúdo, 3) construção do diálogo, 4) teste do protótipo e 5) integração com página de mídia social. Resultados: a revisão de literatura reuniu evidências científicas sobre a doença a partir das publicações do Ministério da Saúde, no Brasil, e de consultas em artigos científicos. O conteúdo foi construído a partir das perguntas mais realizadas pela população, em março de 2020, evidenciadas por meio do Google Trends, em que emergiram os seguintes temas: conceito da doença, formas de prevenção, transmissão da doença, principais sintomas, formas de tratamento e dúvidas. A construção do diálogo foi baseada em Processamento de Linguagem Natural, intenções, entidades e estrutura de diálogo. O protótipo foi testado em laboratório com um número reduzido de computadores usuários em uma rede local para verificar a funcionalidade do conjunto de aplicações, erros técnicos e visuais acerca do diálogo e se as respostas fornecidas estavam de acordo com a pergunta do usuário, respondendo de forma correta os questionamentos e integrado ao Facebook. Conclusão: o assistente virtual mostrou-se uma ferramenta de educação em saúde e com potencial para combater fake news. Também representa uma forma de comunicação em saúde centrada no paciente, que favorece o fortalecimento de vínculo e interação entre profissionais de saúde e pacientes, promovendo a coprodução em saúde.

O uso do Twitter como minerador de eventos adversos de medicamentos de combate à malária: o caso da doxiciclina / El uso de Twitter como localizador de eventos adversos con medicamentos de combate a la malaria: el caso de la doxiciclina / Mining in Twitter for adverse events from malaria drugs: the case of doxycycline

Duval, Felipe Vieira; Silva, Fabrício Alves Barbosa da.

Cad. Saúde Pública (Online) ; 35(5): e00033417, 2019. tab, graf

Artigo em Português | LILACS | ID: biblio-1001664

RESUMO

Durante o período de pós-comercialização, quando medicamentos são usados por grandes populações e por períodos de tempo maiores, eventos adversos (EA) inesperados podem ocorrer, o que pode alterar a relação risco-benefício dos medicamentos o suficiente para exigir uma ação regulatória. Eventos adversos são agravos à saúde que podem surgir durante o tratamento com um produto farmacêutico, os quais, no período de pós-comercialização do medicamento, podem requerer um aumento significativo de cuidados de saúde e resultar em danos desnecessários aos pacientes, muitas vezes fatais. Portanto, o quanto antes, a descoberta de EA no período de pós-comercialização é um objetivo principal do sistema de saúde. Alguns países possuem sistemas de vigilância farmacológica responsáveis pela coleta de relatórios voluntários de EA na pós-comercialização, mas estudos já demonstraram que, com a utilização de redes sociais, pode-se conseguir um número maior e mais rápido de relatórios. O objetivo principal deste projeto é construir um sistema totalmente automatizado que utilize o Twitter como fonte para encontrar EA novos e já conhecidos e fazer a análise estatística dos dados obtidos. Para isso, foi construído um sistema que coleta, processa, analisa e avalia tweets em busca de EA, comparando-os com dados da Agência Americana de Controle de Alimentos e Medicamentos (FDA) e do padrão de referência construído. Nos resultados obtidos, conseguimos encontrar EA novos e já existentes relacionados ao medicamento doxiciclina, o que demonstra que o Twitter, quando utilizado em conjunto com outras fontes de dados, pode ser útil para a farmacovigilância.

Durante el período de poscomercialización, cuando grandes poblaciones consumen medicamentos durante períodos más prolongados de tiempo, se pueden producir eventos adversos (EA) inesperados, lo que puede alterar la relación riesgo-beneficio de los medicamentos. Esta situación es suficiente para exigir una acción regulatoria. Los EA son agravios a la salud que pueden surgir durante el tratamiento con un producto farmacéutico, los cuales, durante el período de poscomercialización del medicamento, pueden requerir un aumento significativo de cuidados de salud y resultar en lesiones innecesarias para los pacientes, muchas veces fatales. Por lo tanto, el hallazgo anticipado de EA durante el período de poscomercialización es un objetivo primordial del sistema de salud. Algunos países cuentan con sistemas de vigilancia farmacológica, responsables de la recogida de informes voluntarios de EA durante la poscomercialización, pero algunos estudios ya demostraron que, con la utilización de las redes sociales, se puede conseguir un número de informes mayor y más rápido. El objetivo principal de este proyecto es construir un sistema totalmente automatizado que utilice Twitter como fuente para encontrar nuevos EA y ya conocidos, además de realizar un análisis estadístico de los datos obtenidos. Para tal fin, se construyó un sistema que recoge, procesa, analiza y evalúa tweets en búsqueda de eventos adversos, comparándolos con datos de la Agencia Americana de Control de Alimentos y Medicamentos (FDA) y del estándar de referencia construido. En los resultados obtenidos, conseguimos encontrar nuevos eventos adversos y ya existentes, relacionados con el medicamento doxiciclina, lo que demuestra que Twitter, cuando es utilizado junto a otras fuentes de datos, puede ser útil para la farmacovigilancia.

During the post-marketing period, when medicines are used by large population contingents and for longer periods, unexpected adverse events (AE) can occur, potentially altering the drug's risk-benefit ratio enough to demand regulatory action. AE are health problems that can occur during treatment with a pharmaceutical product, which in the drug's post-marketing period can require a significant increase in health care and result in unnecessary and often fatal harm to patients. Therefore, a key objective for the health system is to identify AE as soon as possible in the post-marketing period. Some countries have pharmacovigilance systems responsible for collecting voluntary reports of post-marketing AE, but studies have shown that social networks can be used to obtain more and faster reports. The current project's main objective is to build a totally automated system using Twitter as a source to detect both new and previously known AE and conduct the statistical analysis of the resulting data. A system was thus built to collect, process, analyze, and assess tweets in search of AE, comparing them to U.S. Food and Drug Administration (FDA) data and the reference standard. The results allowed detecting new and existing AE related to the drug doxycycline, showing that Twitter can be useful in pharmacovigilance when employed jointly with other data sources.

Assuntos

Humanos , Sistemas de Notificação de Reações Adversas a Medicamentos , Doxiciclina/efeitos adversos , Efeitos Colaterais e Reações Adversas Relacionados a Medicamentos/prevenção & controle , Mineração de Dados/métodos , Mídias Sociais , Estados Unidos , United States Food and Drug Administration , Preparações Farmacêuticas/classificação , Bases de Dados Factuais , Disseminação de Informação , Farmacovigilância , Malária/tratamento farmacológico

Translation of UMLS ontologies from european portuguese to brazilian portuguese / Translation of UMLS ontologies from european portuguese to brazilian portuguese

Oliveira, Lucas Emanuel Silva e; Hasan, Sadid A; Farri, Oladimeji; Moro, Claudia Maria Cabral.

J. health inform ; 8(supl.I): 373-380, 2016. tab

Artigo em Inglês | LILACS | ID: biblio-906292

RESUMO

Ontologias terminológicas padronizadas e corretamente traduzidas são essenciais para o desenvolvimento de aplicações de processamento de linguagem natural na área da saúde. Para o desenvolvimento de uma aplicação de busca semântica em narrativas clínicas em português se fez necessária a utilização dos termos clínicos da Unified Medical Language System (UMLS). OBJETIVOS: Traduzir termos da UMLS em Português Europeu para Português Brasileiro. MÉTODOS: Foi desenvolvido um algoritmo de tradução semi-automática baseada em regras de substituição de texto. RESULTADOS: Após execução do algoritmo e avaliação por parte de especialistas, o algoritmo deixou de traduzir corretamente apenas 0.1% dos termos da base de testes. CONCLUSÃO: A utilização do método proposto se mostrou efetivo na tradução dos termos da UMLS e pode auxiliar em posteriores adaptações de listagens em Português Europeu para Português Brasileiro.

Correctly translated and standardized clinical ontologies are essential for development of Natural LanguageProcessing application for the medical domain. To develop an ontology-driven semantic search application for Portuguese clinical notes we needed to implement the Unified Medical Language System (UMLS) ontologies, specifically for Brazilian Portuguese. OBJECTIVES: To translate UMLS terms from European Portuguese to Brazilian Portuguese. METHODS: To develop a semi-automatic translation algorithm based on string replacement rules. RESULTS: Following the experiments and specialists' evaluation the algorithm mis-translated only 0.1% of terms in our test set. CONCLUSION: The proposed method proved to be effective for UMLS clinical terms translation and can be useful for posterior adaption ofa set of clinical terms from European Portuguese to Brazilian Portuguese.

Assuntos

Humanos , Tradução , Processamento de Linguagem Natural , Congressos como Assunto

Metodologias e ferramentas para anotação de narrativas clínicas / Methodologies and tools for clinical narratives annotation

Andrade, Gabriel Herman Bernardim; Oliveira, Lucas Emanuel Silva e; Moro, Claudia Maria Cabral.

J. health inform ; 8(supl.I): 1031-1040, 2016. ilus

Artigo em Português | LILACS | ID: biblio-906773

RESUMO

A utilização de técnicas de Processamento de Linguagem Natural (PLN) em textos clínicos é amplamente dependente de grandes quantidades de dados textuais anotados, denominados corpus ou padrão ouro. Sendo essenciais para a modelagem da linguagem durante a fase de treinamento de diversos algoritmos de PLN. Porém, para a criação de um padrão ouro é necessário um extenso e custoso trabalho manual de anotação, que demanda um grande esforço de especialistas. OBJETIVO: Realizar uma revisão da literatura, visando o estudo de metodologias e ferramentas utilizadas em procedimentos de anotação de textos. MÉTODO: Levantamento em bases científicas referentes à elaboração de corpus morfológicos, sintáticos e morfossintáticos foi realizado, analisando 32 estudos de anotação e mais 12 ferramentas. RESULTADOS: Foram levantados os principais aspectos nos processos de anotação, bem como realizada uma avaliação dentre critérios pré-definidos de cada das ferramentas de suporte encontradas.

The use of natural language processing techniques (NLP) in clinical texts is dependent on large amounts of annotated text data, called corpus or gold standard. Are essential for the modelling language during the training phase of NLP algorithms. However, for the creation of a gold standard is required extensive and costly manual annotation task, that demands a great deal of experts. OBJECTIVES: To review the literature to identify methodologies and tools applied to text annotation. METHODS: Scientifics databases search regarding the development of morphological, syntactic and morphosyntactic corpus was performed by analyzing 32 annotation studies and 12 tools. RESULTS: Main aspects of the annotation process description, as well as an assessment from pre-defined criteria for each one of the annotation tools identified.

Assuntos

Humanos , Processamento de Linguagem Natural , Software , Armazenamento e Recuperação da Informação , Congressos como Assunto

Automatic classification of written descriptions by healthy adults: an overview of the application of natural language processing and machine learning techniques to clinical discourse analysis / Classificação automática de discurso descritivo escrito de adultos sadios: uma visão geral da aplicação de técnicas de processamento de línguas naturais e aprendizado de máquina à análise clínica do discurso

Toledo, Cíntia Matsuda; Cunha, Andre; Carolina, Scarton; Aluísio, Sandro.

Dement. neuropsychol ; 8(3)set. 14.

Artigo em Inglês | LILACS | ID: lil-724274

RESUMO

Discourse production is an important aspect in the evaluation of brain-injured individuals. We believe that studies comparing the performance of brain-injured subjects with that of healthy controls must use groups with compatible education. A pioneering application of machine learning methods using Brazilian Portuguese for clinical purposes is described, highlighting education as an important variable in the Brazilian scenario. Objective: The aims were to describe how to: (i) develop machine learning classifiers using features generated by natural language processing tools to distinguish descriptions produced by healthy individuals into classes based on their years of education; and (ii) automatically identify the features that best distinguish the groups. Methods: The approach proposed here extracts linguistic features automatically from the written descriptions with the aid of two Natural Language Processing tools: Coh-Metrix-Port and AIC. It also includes nine task-specific features (three new ones, two extracted manually, besides description time; type of scene described ? simple or complex; presentation order ? which type of picture was described first; and age). In this study, the descriptions by 144 of the subjects studied in Toledo18 were used,which included 200 healthy Brazilians of both genders. Results and Conclusion: A Support Vector Machine (SVM) with a radial basis function (RBF) kernel is the most recommended approach for the binary classification of our data, classifying three of the four initial classes. CfsSubsetEval (CFS) is a strong candidate to replace manual feature selection methods.

Um importante aspecto na avaliação de indivíduos com lesão cerebral é a produção de discurso. Acreditamos que estudos que comparam o desempenho de lesados com grupos de controles sadios devem utilizar grupos com escolaridade compatíveis. Nós apresentamos uma abordagem pioneira ao utilizar métodos de aprendizado de máquina com propósitos clínicos, para o Português do Brasil, destacando a escolaridade como variável de importância no cenário brasileiro. Objetivo: Nosso objetivo é descrever como: (i) desenvolver classificadores via aprendizado de máquina, usando features criadas por ferramentas de processamento de línguas naturais, para diferenciar descrições produzidas por indivíduos sadios em classes de anos de escolaridade e (ii) identificar automaticamente as features que melhor distinguem esses grupos. Métodos: A abordagem proposta neste estudo extrai características linguísticas automaticamente a partir das descrições escritas com a ajuda de duas ferramentas de Processamento de Linguagem Natural: Coh-Metrix-Port e AIC. Ela inclui ainda nove features dedicadas à tarefa (três novas, duas extraídas manualmente, além de tempo de descrição; tipo de cena descrita - simples ou complexa; ordem de apresentação das figuras e idade). Neste estudo, foram utilizadas as descrições de 144 indivíduos estudados em Toledo18, que incluiu 200 brasileiros, sadios, de ambos sexos. Resultados e Conclusão: SMV com kernel RBF é o mais recomendado para a classificação binária dos nossos dados, classificando três das quatro classes iniciais. O método de seleção das features CfsSubsetEval (CSF) é um forte candidato para substituir métodos de seleção manual.

Assuntos

Humanos , Processamento de Linguagem Natural , Adulto , Escolaridade , Grupos Etários

RESUMO

Assuntos

RESUMO

RESUMO

RESUMO

RESUMO

Assuntos

RESUMO

Assuntos

RESUMO

Assuntos

RESUMO

Assuntos

ENVIAR RESULTADO:

SELEÇÃO DE REFERÊNCIAS

DETALHE DA PESQUISA