Summary: | Lung cancer has become the most lethal malignancy in the world in recent decades. And
despite advances in medicine, there has been little progress regarding the cure of the
disease. According to the National Cancer Institute in the last global estimate of the
incidence of lung cancer in 2012, there were 1.82 million cases of cancer, with 1.24 million
among men and 583 thusand among women. The main cause of lung cancer is smoking
that is responsible for 90 % of diagnosed cases. The diagnosis of lung cancer is done
mainly based on CT images, and today it is considered the main visualization technique
for detecting pulmonary nodules. However, the process of identifying and classi cation of
nodules are complex and involves subjective and qualitative factors that lead experts to
error. This scenario requires the use of computational techniques to e ectively manipulate
the data and provide the means for more accurate diagnoses. Computer systems have
been developed in order to search and retrieve imaging exams already diagnosed which are
similar to a new case with unknown pathology according to the similarity between their
characteristics. This property is intrinsic to Content-Based Image Retrieval (CBIR). Diagnosed
exams retrieved can be used as a second opinion to guide those specialists in the
diagnosis, providing more information. However, CBIR presents some limitations regarding
to the process of segmentation and representation of image characteristics through of
attributes, as well as determine an appropriate similarity metric. This paper presents a
local update weighing algorithm applied to the Weighted Euclidean Distance (WED) in a
CBIR architecture in order to verify if the WED with adjusted weights is more accurate
than the Euclidean Distance in image retrieval of pulmonary nodules. For this, the 3D
Texture Attributes (3D AT) and 3D Margin Sharpness Attributes (3D MSA) were used
to represent nodules. Presente process consists of two phases that are performed sequentially
and cyclically being an Assessment Phase and Training Phase. At each iteration the
weights are adjusted according to the retrieved nodules. At the end of cycles execution,
it is obtained a set of attribute weights that optimize the recovery of similar nodes. The
results achieved by updating the weights were promising and increase precision by 10% to
6% on mean for recovery of benign and malignant nodules respectively with recall 25%.
In the best case, the 3D MSA provided 100% of precision for the two classes with recall
90%. This proves the e ectiveness of the algorithm achieving the goals to this work and
con rms the hypothesis that the DEP, with adjusted weights, provides greater precision
than DE as a similarity metric in CBIR systems. === Fundação de Amparo a Pesquisa do Estado de Alagoas === O câncer de pulmão se tornou a neoplasia maligna mais letal do mundo nas últimas
décadas. E, apesar dos avanços na medicina, houve pouco progresso com relação à cura
da doença. Segundo o INCA, na última estimativa mundial sobre a incidência de câncer
pulmonar, em 2012, foram registrados 1,82 milhão de casos de câncer, sendo 1,24 milhão
entre os homens e 583 mil entre as mulheres. O principal causador do câncer pulmonar é o
tabagismo sendo responsável por 90% dos casos diagnosticados. O diagnóstico do câncer
pulmonar é feito, principalmente, com base em imagens de TC e, hoje, é considerada
a principal técnica de visualização para detecção de nódulos pulmonares. Entretanto, o
processo de identi cação e classi cação de nódulos é complexo e envolve fatores subjetivos
e qualitativos que acabam induzindo os especialistas ao erro. Este panorama exige o
emprego de técnicas computacionais que permitam efetivamente manipular os dados e
proporcionar meios para diagnósticos mais precisos. Sistemas computacionais têm sido
desenvolvidos com o objetivo de buscar e recuperar imagens de exames já diagnosticados,
que são similares a um novo caso com patologia ainda desconhecida segundo a similaridade
entre as suas características. Essa propriedade é intrínseca aos sistemas CBIR. Os exames
diagnosticados recuperados podem ser utilizados como uma segunda opinião para guiar
os especialistas no momento do diagnóstico, fornecendo informações adicionais. Contudo,
CBIR apresenta algumas limitações referentes ao processo de extração e representação de
características das imagens, por meio de atributos, e a determinação de uma métrica de
similaridade adequada. Este trabalho apresenta um algoritmo de ajuste local de pesos
aplicado à DEP em uma arquitetura CBIR com o objetivo de veri car se a DEP com os
pesos ajustados é mais precisa do que a DE na recuperação de imagens contendo nódulos
de câncer pulmonar. Para isso, foram utilizados os AT 3D e os ANB 3D para representar
os nódulos. O processo apresentado é composto por duas fases que são executadas de
forma sequencial e cíclica sendo uma Fase de Avaliação e uma de Fase de Treinamento.
A cada iteração os pesos são ajustados segundo os nódulos recuperados. Ao término do
ciclo de execuções das fases, obtém-se um conjunto de pesos de atributos que otimizam a
recuperação de nódulos semelhantes. Os resultados alcançados pela atualização dos pesos
foram promissores aumentando a precisão em 10% e 6% em média para recuperação de
nódulos benignos e malignos, respectivamente, com revocação de 25%. No melhor caso,
o ANB 3D proporcionou 100% para recuperação das duas classes com revocação de 90%.
Isso comprova a e cácia do algoritmo alcançando os objetivos almejados para o trabalho e
con rmando a hipótese de que a DEP com os pesos ajustados proporciona maior precisão
do que DE como métrica de similaridade em sistemas CBIR.
|