"이 노래 뜰까?" 97% 정확한 히트곡 식별법 등장
신경데이터에 결합, 어떤 노래 히트할지 거의 완벽한 식별
날마다 수많은 신곡이 쏟아진다. 옵션이 많은 만큼 스트리밍 서비스에서는 재생 목록에 추가할 노래를 선택하기가 쉽지 않다. 그래서 많은 사람이 반응을 보일 만한 곡을 찾기 위해 청취자와 인공지능 등 다양한 접근방법을 사용하지만 여전히 히트 가능성을 신뢰성 있게 예측하지 못한다. 새로운 연구에 의하면 뇌 반응에 적용된 포괄적인 기계 학습 기술을 사용한 결과 97%의 정확도로 히트곡을 예측할 수 있었다.
시니어저자인 미국 클레이몬트대학원 폴 잭 교수는 “기계 학습을 신경생리학적 데이터에 적용함으로써 우리는 히트곡을 거의 완벽하게 식별할 수 있었다”고 말했다. 그는 “33명의 사람들의 신경 활동을 바탕으로 수백만 명이 새로운 노래를 들었을 때 반응을 예측할 수 있다는 것은 매우 놀라운 일”이라면서 “이 정도 정확성에 가까운 방법은 나온 적이 없다”고 덧붙였다.
신경학적 데이터를 사용한 기계학습
이번 연구에서 참여자들은 일반적인 센서를 장착하고 24곡을 들은 뒤 선호도와 인구통계 데이터에 대해 답했다. 실험을 하는 동안 노래에 대한 이들의 신경 생리학적 반응이 측정됐다. 잭 교수는 “우리가 수집한 뇌 신호는 기분과 에너지 수준과 관련된 뇌 네트워크의 활동을 반영한다”고 말했다. 이를 통해 작은 데이터를 기반으로 노래의 스트리밍 회수를 비롯한 시장 결과를 예측할 수 있었다. 이같은 접근법을 ‘신경 예측’이라고 부른다. 인구 수준의 효과를 예측하기 위해 많은 사람의 뇌 활동을 측정할 필요없이 소그룹 사람들의 신경 활동을 포착하는 것이다.
데이터 수집 이후 연구팀은 신경생리학적 변수의 예측 정확도를 평가하기 위해 다양한 통계적 접근법을 사용했다. 예측 정확도를 높이기 위해 다양한 알고리즘을 테스트하는 기계학습모델을 훈련시켰다.
연구팀에 따르면 선형적 통계 모델은 69%의 성공률로 히트곡을 식별했다. 수집 데이터에 기계 학습을 적용했을 때, 정확하게 식별된 히트곡의 비율은 97%로 증가했다.
그리고 연구팀은 노래 시작 후 첫 1분에 대한 신경 반응에 기계 학습을 적용했다. 이 경우는 82%의 정확도로 히트곡이 식별됐다.
잭 교수는 “이는 스트리밍 서비스가 히트 가능성이 높은 신곡을 더 효율적으로 쉽게 식별할 수 있음을 의미한다”면서 “이를 통해 스트리밍 서비스의 선곡이 보다 쉬워지고 듣는 사람들을 즐겁게 할 수 있다”고 덧붙였다.
히트곡 식별을 넘어 다른 분야에 적용 가능
잭 교수는 “우리가 이 연구에 사용했던 것과 같은 착용 가능한 신경과학 기술이 미래에 보편화되면, 신경생리학에 기초해 사람들에게 적절한 오락물을 보낼 수 있을 것”이라면서 “수백 개 선택권 대신에 두 세가지 중에서 고를 수 있으면 자신이 즐길 음악을 더 쉽고 빠르게 선택할 수 있다”고 말했다.
이번 연구에는 한계도 있다. 비교적 적은 수의 노래를 분석에 사용했고, 특정 인종과 연령 그룹의 구성원들이 포함되지 않았다. 그럼에도 불구하고 연구팀은 새로운 방법론이 히트곡 식별을 넘어 다른 분야에 사용될 수 있을 것으로 기대한다. 잭 교수는 “이같은 접근 방식은 영화와 TV 프로그램을 포함한 많은 다른 종류 엔터테인먼트의 히트작을 예측하는 데 사용될 수 있을 것으로 보인다”고 말했다.
연구는 ≪인공지능의 프론티어≫에 발표됐다. 원제는 ‘Accurately Predicting Hit Songs using Neurophysiology and Machine Learning’.