인공 지능을 사용하여 폐암 유형 분류, 돌연변이 예측

2018년 10월 10일 : 국립암연구소 제공

연구자들은 조직 샘플의 슬라이드를 읽는 컴퓨터 프로그램을 훈련시켜 가장 흔한 두 종류의 폐암을 97% 정확도로 진단했다. 이 프로그램은 암 조직의 영상을 분석하는 것만으로도 샘플에서 암 관련 유전자 돌연변이를 알아내는 법을 배웠다.

기계학습이라고 알려진 과정에서, 그 컴퓨터 프로그램은 조직 조각의 이미지를 스캔했고, 정상 폐 조직과 폐암의 두 가지 가장 흔한 형태인 선암과 편평세포 암을 구별하는 능력을 개발하였다. 선암은 폐암의 약 40%를 점하며, 편평세포 암은 약 25%~30%를 점한다. 심지어 경험 많은 병리학자들도 이 두 종류의 폐암을 구별하는데 어려움에 부닥칠 수 있는데, 이것은 다른 종류의 세포에서 발생하며 매우 다른 치료 요법을 필요로 한다.

컴퓨터 프로그램을 훈련시키기 위해서, 기계 학습을 전공한 연구원들은 구글이 원래 개발하고 출판한 심오한 학습 방법을 사용했다. 이 프로그램은 인공 지능(AI)을 사용하여 과업을 더 잘 할 수 있도록 가르치고 있다. 이 경우 정확하게 방법은 들을 필요 없이 폐암 샘플을 분류한다.

이 프로그램은 '암 게놈 지도' (TCGA)가 공개적으로 사용할 수 있도록 만든 1,600개 이상의 폐 샘플 조직병리학 슬라이드를 사용하여 훈련을 받았다. 뉴욕대학교 랭곤 메디컬 센터의 연구원들이 주도하고 9월 17일에 네이처 메디컬에 발표한 이 연구는 폐암을 진단하기 위한 컴퓨터를 사용한 방식의 정확도가 크게 향상되었음(97%의 정확도)을 나타냈으며, 이것 다음으로 가장 정확한 컴퓨터 방식은 83%이다.

데이터 및 공공 자원으로서의 화상

암 게놈 지도는 이 프로젝트에서 수집된 유전자 염기서열 데이터를 연구하는 연구원들을 위해 종양 검체의 조직병리학적 영상을 품질 관리 기준으로 삼았다. "조직의 품질과 정체성이 정확한지 확인하기 위해 화상들이 필요했습니다," 라고 국립암연구소의 암 게놈 지도 책임자인 장 C. 젠클루센 박사가 말했습니다. Zenklusen 박사는 부수적인 이익으로서, 영상 자체가 이제 분석을 위한 자료로 사용되고 있다고 말했다.

암 게놈 지도에서 사용할 수 있는 이미지는 크고 고해상도로, 뉴욕대학의 연구원들은 각 화상을 수천 개의 타일 또는 "패치"로 나누고, 이 패취는 샘플의 분류로 연결될 수 있도록 시각적 단서를 위해 개별적으로 분석할 수 있는 컴퓨터 프로그램에 저장하였다. "우리는 서브 타입에 따라 약 500명의 환자가 있었지만, 이미지 당 수천 개의 패치가 있었습니다. 그래서 우리는 이 모델을 훈련시키기 위해 거의 백만 개의 패치를 만들었습니다,"라고 이 연구가 진척되도록 도운 뉴욕대학 랭곤 의료센터의 기계학습 및 인공지능 연구원인 나지스 라자비언 박사가 말했다.

프로그램이 선암과 편평세포 암 및 정상적인 폐 세포를 구별할 수 있도록 학습시킨 정확도는 숙련된 병리학자의 그것과 거의 같은 수준이지만, 분석 속도는 훨씬 더 빨리 이루어질 수 있다. 병리학자가 수분 만에 결론을 내릴 수 있다면 이 프로그램은 수초 안에 가능하였다.

이 프로그램은 연구에 참여한 3명의 병리학자 중 적어도 1명이 분류 오류를 낸 54개 이미지 중 45개를 정확하게 분류하였고, AI가 유용한 제2의 의견을 제시할 수 있음을 시사했다.

이 프로그램은 완전히 분리된 샘플 컬렉션에서 작동하는지 확인하기 위해 냉동 및 신선하게 수집되어 뉴욕대학에서 독립적인 폐암 검체 세트에서 테스트를 받았다.

암 게놈 지도의 샘플은 거의 종양 조직이었다. 그러나 이 유효성검사 세트에서는 혈액응고나 죽은 조직과 같은 다른 성분이 포함되어 있어 이 프로그램에 대한 분류 작업이 더 어려워지는 경우가 많다고 연구원들은 보고했다.

이에 대응하여, 연구원들은 병리학자들이 식별한 대로 대부분이 종양인 조직 샘플의 부분들에 초점을 맞추도록 프로그램을 재 작업했다. 이러한 변화로 이 방법의 정확도는 평균 90% 이상이었으며, 이것은 "매우 고무적인" 것이라고 연구원들이 묘사했다.

치료와 연구에서의 AI의 역할

컴퓨터 프로그램의 속도와 정확성 때문에, 예를 들어 생체검사를 통해 진단을 내리거나 외과의사에게 또 다른 검체가 필요하다는 것을 알리는 데 도움이 되도록 수술 중에도 이 프로그램을 사용할 수 있다고 연구 팀이 제안했다.

인공지능(AI)이 빠르고 정확한 진단을 위해 사용될 수 있다는 것을 보여주는 것 외에도, 유전자에 따라서는 64%에서 86%의 정확도로 AI가 폐 선암에 있는 6가지의 가장 흔한 유전자 변형을 예측하도록 훈련시킬 수 있다는 것을 연구 프로젝트에서 보여주었다.

"그것은 과학적으로 매우 흥분되는 일" 이라고 라자비안 박사가 말했다.

현재로는, 인간이 유전자 변이를 탐지할 수 있는 유일한 방법은 최대 2주까지 걸릴 수 있는 DNA 염기서열 분석이다.

라자비안 박사는 "폐암은 대개 병의 진행이 이미 되어버린 상태로 늦게 발견되므로, 치료를 시작하기 위해 2주를 기다리는 것은 환자에게 좋지 않다"고 말했다.

많은 의료팀들이 치료를 시작하고 유전자 검사 결과에 따라 사용하는 약을 조정할 것이다. "그러나 우리가 보여주는 것은, 이 프로그램을 통해, 의사들은 더 즉각적으로 올바른 치료가 될 가능성이 높은 치료를 시작할 수 있다는 것." 이라고 라자비안 박사가 말했다.

이 프로그램은 그 결정이 요약하기 쉽지 않은 수천 개의 서로 연결된 작은 단계들의 결과라는 점에서 "블랙박스"이다. 연구원들은 이 프로그램이 유전 돌연변이의 존재를 예측하기 위해 화상에서 정확히 무엇을 탐지하는지 시각화할 수는 없지만 이 프로그램은 "눈으로 알아보기 어려운 패턴을 보여주는 렌즈" 역할을 할 수 있습니다.

라자비언 박사와 그녀의 동료들은 이 프로그램을 이용하여 유전적 돌연변이가 세포와 조직의 구조에 어떻게 영향을 미치는지를 연구하고 있다. 이 문제에 접근하기 위해, 그들은 어떤 시각적 요소가 프로그램의 돌연변이를 인지하는 능력에 가장 큰 영향을 미치는지 알아내기 위해 이미지를 수정하는 자동화된 방법을 사용하고 있다.

NCI 암 영상 프로그램의 부 책임자인 폴라 제이콥스 박사는 "이 연구의 강점은 치료해야 할 임상 문제의 신중한 선택이며, 프로그램의 훈련 방법과 결과를 별개의 폐암 검체를 사용하여 확인한다는 사실“이라고 말했다.

마이클 스나이더 스탠포드 대 유전학 과장은 AI를 진단의 미래로 보고 있다. "모든 일을 하기 위해 병리학자들만 의지하기 보다는 기계학습으로 옮겨야 한다고 생각합니다."라고 그가 말했습니다. "알고리즘은 병리학자를 대체하지 않지만, 학자들이 분류하는 데에는 도움이 될 것입니다. 그렇지 않으면 병리학자들이 범하는 실수를 줄일 수 있을 것입니다."

이 프로젝트를 위해 개발된 코드는 다른 연구자들이 다른 진단 응용 프로그램에 사용할 수 있도록 한다. 뉴욕대학 연구팀은 이미 신장 암과 유방암, 그리고 다른 암의 진단법을 배우는데 이 코드를 사용하기 시작했다.

Using Artificial Intelligence to Classify Lung Cancer Types, Predict Mutations

October 10, 2018, by NCI Staff

Researchers have trained a computer program to read slides of tissue samples to diagnose two of the most common types of lung cancer with 97% accuracy. The program also learned to detect cancer-related genetic mutations in the samples just by analyzing the images of cancer tissue.

In a process known as machine learning, the computer program scanned images of tissue slices and developed the ability to differentiate normal lung tissue from the two most common forms of lung cancer, adenocarcinomas, which make up about 40% of lung cancers, and squamous cell carcinomas, which make up about 25% to 30% of lung cancers. Even experienced pathologists can struggle to distinguish these two types of lung cancer, which arise from different types of cells and require very different treatment regimens.

To train the computer program, researchers specializing in machine learning used a deep learning method originally developed and published by Google. The program uses artificial intelligence (AI) to teach itself to get better at a task—in this case, classifying lung cancer specimens—without being told exactly how.

The program was trained using more than 1,600 histopathology slides of lung specimens made publicly available by The Cancer Genome Atlas (TCGA). The study, led by researchers at New York University's Langone Medical Center and published September 17 in Nature Medicine, represents a large improvement in the accuracy of computational methods to diagnose lung cancer; the second most accurate computational method has an accuracy rate of 83%.

Images as Data and a Public Resource

TCGA made histopathology images of tumor specimens available as a quality control measure for researchers studying the genetic sequence data collected in the project. The images “were required to make sure that the quality and identity of the tissue were correct,” said Jean C. Zenklusen, Ph.D., the director of TCGA at NCI. As an incidental benefit, Dr. Zenklusen said, the images themselves now serve as a resource for analysis.

The images made available by TCGA are large and high resolution, so the researchers at NYU divided each image into thousands of tiles, or “patches,” in a grid for the computer program to analyze individually for visual cues that could be linked to the sample’s classification. “We had about 500 patients per [lung cancer] subtype, but thousands of patches per image, so we had nearly one million patches in the end to train the model,” said Narges Razavian, Ph.D., a machine learning and AI researcher at NYU Langone, who helped lead the study.

The accuracy with which the program learned to distinguish adenocarcinoma from squamous cell carcinoma and normal lung cells was about equal to that of experienced pathologists, but the analysis can be done much faster; the program was able to reach a conclusion in a matter of seconds rather than the minutes a pathologist would need.

The program also correctly classified 45 of 54 images that at least one of three pathologists participating in the study misclassified, suggesting that AI could offer a useful second opinion, the researchers wrote.

The program was tested on an independent set of lung cancer specimens—both frozen and freshly collected—from NYU to verify that it worked on a completely separate collection of samples.

The samples from TCGA were almost entirely tumor tissue. In this validation set, however, the samples often included other components, such as blood clots and dead tissue, “making the classification task more challenging” for the program, the researchers reported.

In response, they reworked the program to have it focus on the parts of the tissue samples that were largely tumor (as identified by a pathologist). With that change, the method’s accuracy averaged more than 90%, which they described as “very encouraging.”

AI’s Role in Treatment and Research

Because of the computer program’s speed and accuracy, the research team suggested the tool could be used during surgery, for example, to help verify that a biopsy is of sufficient quality to make a diagnosis or to inform a surgeon that another sample is needed.

In addition to showing that AI can be used to make a quick and accurate diagnosis, the research project showed that AI could be trained to predict the presence of six of the most common genetic mutations in lung cancer adenocarcinoma, with an accuracy ranging from 64% to 86%, depending on the gene.

“That is very exciting scientifically,” Dr. Razavian said.

Currently, the only way humans can detect genetic mutations is by DNA sequencing, which can take up to 2 weeks.

“Lung cancer is usually detected late in the progression of the disease, so waiting 2 weeks to start any treatment is bad for the patient,” Dr. Razavian noted.

Many medical teams will start treatment and then adjust the medication used based on genetic test results. “What we show is that, with this program, you could start a treatment that is more likely to be the right one immediately,” Dr. Razavian said.

The program is a “black box,” in that its decisions are the result of thousands of interconnected small steps, not easy to summarize. The researchers can’t visualize exactly what the program detects in an image to predict the presence of genetic mutations, but the program can serve as “a lens that shows patterns that are hard to notice with the eye,” Dr. Razavian said.

She and her colleagues are using the program to research how genetic mutations affect the structures of cells and tissues. To approach this problem, they are using automated methods that modify the images to figure out what visual elements most influence the program’s ability to perceive mutations.

“The strengths of the study,” said Paula Jacobs, Ph.D., the associate director of NCI’s Cancer Imaging Program, “are the careful selection of the clinical problem to be addressed,” how the program was trained, and the fact that the results were verified using an independent set of lung cancer specimens.

Michael Snyder, Ph.D., chair of genetics at Stanford University, sees AI as the future of diagnosis. “I think we need to shift to using machine learning rather than rely on pathologists alone to do all the work,” he said. “Algorithms won’t replace pathologists, but they will assist them in making classifications. They will reduce the errors that pathologists would otherwise make.”

The code developed for the project is available for other researchers to use for other diagnostic applications. The NYU team has already started applying the code to learn to diagnose kidney, breast, and other cancers.

저작권자 © 암스쿨 무단전재 및 재배포 금지