인간처럼 더 많은 것을 배울 수 있도록 기계를 훈련시키세요
MIT 뉴스 오피스 웹사이트에서 다운로드할 수 있는 이미지는 Creative Commons Attribution Non-Commercial No Derivatives 라이센스에 따라 비영리 단체, 언론 및 일반 대중에게 제공됩니다. 제공된 이미지를 크기에 맞게 자르는 것 외에는 변경할 수 없습니다. 이미지를 복제할 때는 크레디트 라인을 사용해야 합니다. 아래에 제공되지 않은 경우 이미지를 "MIT"로 표시하십시오.
이전 이미지 다음 이미지
공원 벤치에 앉아 누군가가 지나가는 모습을 지켜본다고 상상해 보세요. 사람이 걸을 때 장면이 끊임없이 바뀔 수 있지만, 인간의 두뇌는 시간이 지남에 따라 역동적인 시각적 정보를 보다 안정적인 표현으로 변환할 수 있습니다. 지각 교정으로 알려진 이 능력은 걷는 사람의 궤적을 예측하는 데 도움이 됩니다.
인간과 달리 컴퓨터 비전 모델은 일반적으로 지각적 직선성을 나타내지 않으므로 매우 예측할 수 없는 방식으로 시각적 정보를 표현하는 방법을 배웁니다. 그러나 머신러닝 모델에 이러한 기능이 있다면 물체나 사람이 어떻게 움직일지 더 잘 예측할 수 있을 것입니다.
MIT 연구원들은 특정 훈련 방법이 컴퓨터 비전 모델이 인간처럼 보다 지각적으로 직선적인 표현을 학습하는 데 도움이 될 수 있음을 발견했습니다. 훈련에는 기계 학습 모델이 작업을 학습할 수 있도록 수백만 개의 예제를 보여주는 것이 포함됩니다.
연구진은 이미지에 추가된 작은 오류에 덜 반응하게 만드는 적대적 훈련이라는 기술을 사용하여 컴퓨터 비전 모델을 훈련하면 모델의 지각 직진성이 향상된다는 사실을 발견했습니다.
또한 팀은 모델이 수행하도록 훈련하는 작업이 지각적 직선성에 영향을 미친다는 사실도 발견했습니다. 이미지 분류와 같은 추상적인 작업을 수행하도록 훈련된 모델은 이미지의 모든 픽셀을 카테고리에 할당하는 것과 같은 보다 세분화된 작업을 수행하도록 훈련된 모델보다 더 지각적으로 직선적인 표현을 학습합니다.
예를 들어, 모델 내의 노드에는 "개"를 나타내는 내부 활성화가 있어 모델이 개의 이미지를 볼 때 개를 감지할 수 있습니다. 지각적으로 직선 표현은 이미지에 작은 변화가 있을 때 보다 안정적인 "개" 표현을 유지합니다. 이로 인해 더욱 견고해졌습니다.
연구자들은 컴퓨터 비전의 지각적 직선성에 대한 더 나은 이해를 통해 보다 정확한 예측을 하는 모델을 개발하는 데 도움이 될 수 있는 통찰력을 발견할 수 있기를 희망합니다. 예를 들어, 이 속성은 컴퓨터 비전 모델을 사용하여 보행자, 자전거 타는 사람 및 기타 차량의 궤적을 예측하는 자율 주행 차량의 안전성을 향상시킬 수 있습니다.
Vasha DuTell은 "여기서 중요한 메시지 중 하나는 인간의 시각과 같은 생물학적 시스템에서 영감을 얻으면 특정 사물이 왜 그렇게 작동하는지에 대한 통찰력을 얻을 수 있을 뿐만 아니라 신경 네트워크를 개선하기 위한 아이디어도 얻을 수 있다는 것입니다."라고 말합니다. , MIT 박사후 연구원이자 컴퓨터 비전의 지각 직선성을 탐구하는 논문의 공동 저자입니다.
논문에서 DuTell에 합류한 주요 저자는 전기 공학 및 컴퓨터 과학부(EECS) 대학원생인 Anne Harrington입니다. 박사후 연구원인 Ayush Tewari; 대학원생 마크 해밀턴(Mark Hamilton); Woven Planet의 연구 관리자인 Simon Stent; 뇌 및 인지 과학부의 수석 연구 과학자이자 CSAIL(컴퓨터 과학 및 인공 지능 연구소)의 회원인 Ruth Rosenholtz; 선임 저자인 William T. Freeman, 전기 공학 및 컴퓨터 과학 분야의 Thomas and Gerd Perkins 교수이자 CSAIL 회원입니다. 이 연구는 학습 표현에 관한 국제 회의에서 발표되었습니다.
교정 공부 중
DuTell, Harrington 및 동료들은 인간의 지각 직진성에 관한 뉴욕 대학 연구팀의 2019년 논문을 읽은 후 해당 속성이 컴퓨터 비전 모델에도 유용할 수 있는지 궁금해했습니다.