Back
November 27, 2020
Journal
Audio Machine Learning and Digital Silence
Back
Audio Machine Learning and Digital Silence
TypeJournal DateNovember 27, 2020
노이즈

저는 사운드/미디어 아티스트로 활동하고 있는 권병준이라고 합니다. 디지털 사일런스의 강연 요청을 받고 이 글을 쓰면서 제 생각과 작업을 돌이켜보는 계기가 되었습니다, 감사합니다. 디지털 사일런스의 노이즈와 오류의 미학을 적합하게 논하기보다 제 자신의 관심사에 비약과 궤변을 뒤섞은 글을 이해해주시기 바랍니다. 노이즈를 바라보는 여러 가지 층위 중 소리의 관점에서 본 소음이라 불리는 노이즈, 디지털 신호처리에서의 노이즈, 그리고 문화인류학적 혹은 심리학적 관점에서의 노이즈를 이 글에서 혼용하여 사용하고 있고 이는 작가적 상상력에 기반하고 있음을 먼저 밝힙니다.

노이즈란 무엇인가에 대해 논하기 전에 이 주제를 쉽게 다가갈 수 있게 해주는 제 경험담을 들려드리고 싶습니다. 저는 머레이 셰퍼에서부터 시작된 사운드스케이프라고 불리는 운동 혹은 예술 장르에 꾸준한 관심을 가져왔었고 저로 향한 마이크를 세상 밖으로 돌려 일상의 소리들을 녹음해왔습니다. 근래에는 위치 인식 헤드폰, 거리 인식 헤드폰 등을 만들어 몰입감 있는 청취가 가능하도록 하여 관람객들과 소통하고 있습니다. 그 관람객들 중에는 어린이들도 있습니다. 교육에 관심이 있고 창의적인 소리 교육을 위해 고양 어린이박물관, 부산시립미술관 등에서 어린이를 위한 소리 전시에 참여하고 또 준비하고 있기도 합니다. 그 와중에 어떤 10세 정도 되는 아이에게 제가 2005년경에 하자센터 친구들과 함께 녹음한 지리산 산골 마을의 소리 풍경을 헤드폰으로 들려주었습니다. 그 친구에게 물었습니다. ‘어떤 소리가 들리니?’ 친구의 답은 ‘아무 소리도 안 들려요’였습니다. 그 음원에는 새들의 지저귐, 개 짖는 소리 같은 마을의 고즈넉한 일상이 담겨 있었지만 그 친구에게는 이것은 소리의 영역이 아니었습니다. 우리는 수없이 많은 소리들에 둘러싸여 있고 많은 소리들을 무시하며 살아갑니다. 그 모든 정보에 예민하게 반응하면서 살 수 없는 그래서 무시되어지는 소리들이 있습니다. 노이즈를 정의하는 많은 접근법이 있겠지만 저는 있으되 의식하지 못하는 소리, 들어주기 전에는 들리지 않는 소리라는 가설을 이 강연의 첫머리에 세워봅니다.

소리의 영역에서 노이즈에 관한 정의는 가치관이나 세계관의 표현이기도 합니다. 그리고 저는 그것이 지극히 주관적이기를 바랍니다. 그래서 저는 답을 드리기보다 노이즈에 관한 저의 견해를 밝히려고 합니다. 노이즈가 의식의 영역에 들어오는 순간 노이즈는 더 이상 노이즈가 아닙니다. 어떤 소리를 우리는 차분히 듣기 시작하는 순간, 그 소리를 본격적으로 인지하는 순간 자신의 지식체계에서 해석하고 경험치와 동조하는 효과를 얻습니다. 대상화하여 분석하는 순간 즉 의식의 영역으로 들어오는 순간 그것은 노이즈가 아닌 언어적 메시지가 됩니다. 어떤 이에게 층간 소음은 나를 무시하고 괴롭히려는 이웃의 나쁜 의도가 되는 것처럼요. 동시에 어떤 소리도 노이즈일 수 있습니다. ‘노이즈’와 ‘음악’이라는 대립적 구도는 더 이상 성립하지 않습니다. 음악이 노이즈가 되고 노이즈가 음악적으로 쓰일 수 있음은 이미 수많은 전례가 있었고 이전 디지털 사일런스 세미나에서도 다뤄졌었던 것으로 알고 있으므로 생략하기로 합니다. 자연현상은 수없이 많은 노이즈들로 구성되어 있습니다. 규칙과 반복을 찾으려는 시도에서 법칙과 원리라는 것이 도출되기도 합니다. 하지만 그것은 자연계에 존재하는 노이즈 중 극히 작은 일부일 뿐입니다.

임의의 숫자로 구성된 랜덤 넘버를 디지털 오디오의 관점에서 보통 백색소음(white noise)이라고 부릅니다. 모든 주파수 대역에 동일하게 분배되는 에너지는 그 어떤 규칙이나 반복도 없기에 음정이 느껴지지 않고 말 그대로 혼돈입니다. 빗소리에서 어떤 패턴도 분석할 수 없는 것처럼요. 하지만 많은 사람들은 빗소리를 들으며 편안함을 느낍니다. 백색소음을 필터링한 핑크노이즈를 들으며 폭포를 상상하고 그것의 앰플리튜드를 주기적으로 바꾸는 소리에서 파도를 꿈꿉니다. 오디오 피지컬 모델링의 관점에서 백색소음은 필수적인 재료이고 우리는 자연계의 소리를 디지털로 재구성함에 있어서 신서시스의 주된 재료로 정현파(sine wave)만큼이나 중요하게 쓰이는 것이 바로 노이즈입니다. 문제는 일면 모순된 것처럼 보이는 혼돈이 편안함으로 읽히는 인간의 인지체계입니다. 우리는 도시의 소음에 익숙해져 있고 가전제품의 소음을 들으며 24시간 생활합니다. 어느 마을을 매우 조용하게 만들었을 때 그 마을 주민들의 심리상태가 더 위축되었다는 실험결과가 있습니다. 자연과 도시를 포함하여 우리는 수없이 많은 소음들에 둘러싸여 있으되 현대의 시각 중심의 사회에 길들여져 더 이상 듣지 못하는 소리들이 되어버렸습니다.

이 노이즈가 디지털 신호처리에 쓰이는 방식은 조금 다릅니다. 입력단에서 섞여 들어오는 자연계의 아날로그 노이즈를 최소화하고 목표로 하는 결과치를 내기 위해 제거되어야 할 대상이 됩니다. 물론 다른 쓰임새가 있겠고 그 부분은 김성륜 교수님의 강연에서 잘 설명해 주시리라 생각됩니다. 이 뒤에 얘기할 오디오 머신러닝에서의 노이즈는 입력된 데이터와 유사하지 않은 얘기치 못한 결과물입니다. 디지털 사일런스를 논하기에 적절한 예인지는 모르겠지만 이 오디오 머신러닝을 통해 또다른 예술적 영감을 얻을 수있었기에 그 과정을 공유드리려고 합니다.
오디오 러신머닝

머신러닝을 통해 국악기의 오디오를 분석하고 학습시켜 새로운 음원을 생성하는 프로젝트를 올 7 월부터진행하고 있습니다. 여기에는 한가지 분명한 목표가 있습니다. ‘국악이 본질적으로 가지고 있는 가능성을발견한다’ 입니다. 일제 강점기의 단절된 역사와 왜곡된 전통은 우리의 뿌리마저 흔들어 놓았습니다.잘못된 열매를 따먹고 자란 세대들의 대를 이은 충성은 가야금으로 ‘Let it be’ 를 연주하면서 그것을퓨젼이라고 부르는 매우 안타까운 상황을 만들게 됩니다. 국악을 담을 수 없는 형식인 서양의 오선보를보면서 국악을 연주하게 된 것이죠. 구음전승의 전통은 사라지고 새로운 시도라는 미명아래 벌어진 국악의잔혹사는 참으로 안타까울 따름입니다.

오디오 머신러닝을 통한 연주의 학습은 기존의 악보학습에 비하여 악보에 담을 수 없는 연주자의 섬세한주법까지 컴퓨터에 의해 습득이 가능하고 이를 기반으로 새로운 연주음원을 생성해 냅니다. 50 만번 정도의트레이닝으로 꽤 정교한 장구와 가야금 소리를 생성해 낼 수 있었고 그 생성된 음원은 학습에 기반한즉흥연주에 가깝습니다. Temperature, silence threshold 와 같은 변수를 조절하고 다이나믹 모듈레이션시그널을 이용해 생성음원의 제어는 가능하나 이는 연주의 빈도수와 음색의 변화와 같은 것에 국한됩니다.기본적으로 컴퓨터는 자신의 학습에 기반하여 제시된 시작오디오를 분석, 그다음 점을 찍어나가 파형을만들게 됩니다. 국악기에 대입하기 이전 피아노를 트레이닝하여 생성된 연주는 아래의 링크에서 들어보실수 있습니다.

피아노 트레이닝 이후 생성된 즉흥연주 (앞부분 녹음분 이후 생성된 음원)

가야금, 아쟁, 대금, 장구, 구음을 각 파트별 약 10 시간 분량의 녹음분을 수합하고 16khz 16bit 5sec. 으로전처리하여 4 대의 서버(i7 9 세대 x 3, i9 10 세대 x 1 CPU, NVIDIA Titan 그래픽카드)에서 2020 년 7월부터 트레이닝과 생성의 기록들은 링크에서 확인하실 수 있습니다.

가야금이나 장구처럼 50 만번 정도의 트레이닝으로 의미있는 연주가 생성되는 경우도 있지만 아쟁과대금같이 노트의 듀레이션이 길고 변화가 적은 경우 대부분 노이즈로 결과가 도출되고 그 중 의미있는소리들을 몇개 들려드리도록 하겠습니다.
Temperature 0.98 silence_threshold 0.5, compressed
25K Temperature 0.7 silence_threshold 0.4 compressed
아쟁에 가까운 소리 생성엔 실패했지만 여러 흥미로운 부산물, 아쟁(10초), 에코버전
아쟁의 학습을 통한 흥미로운 오버톤
처음으로 생성된 원본과 유사한 대금소리
이 작업의 중요한 목표중에 하나는 연주자에게 자신의 연주에 내포된 가능성을 보여주는 것입니다. 이 AI무당이 만들어낸 방언과 같은 음원들을 들려줄 때 연주자의 반응은 대부분 안도의 한숨입니다. 역시 기계는멀었구나, 이세돌같이 되지는 않겠구나, 대단한 음악적인 것이 나올 줄 알았는데 결국 ‘노이즈’구나.노이즈는 이 작업의 주된 결과물이었고 이것을 줄여나가 연주자의 귀를 솔깃하게 할만한 소리를 이끌어내는 것이 중요했으므로 그럴듯한 연주와 소리를 찾아가는 과정이 필수적이었습니다.

두번째 단계는 서로다른 데이터를 혼합하여 학습시켜 생성시키는 실험을 진행하였는데 남자구음과여자구음을 합쳐서 학습하고 또는 가야금과 장구를 합쳐서 학습한 후 생성시켰고 결과를 아래에서 들어볼 수있습니다. 서로다른 두개의 소리들이 주고받는 합주가 되거나 장구소리에 가야금의 음색이 더해지는 효과가만들어졌습니다. 데이터의 혼용이 가져오는 흥미로운 결과는 작업의 부산물로 취급되는 수많은 노이즈들을동반하고 이 노이즈들을 다시 학습데이터에 포함시켜 트레이닝하려고 합니다. 학습데이터 내 노이즈빈도수에 따른 생성음원의 또다른 음색을 기대하고 그 새로운 소리의 가능성을 꾾임없이 탐구해보려고합니다.
남성과 여성의 구음을 혼용한 합습에 의한 생성(2분 25초)
디지털 샤마니즘

디지털의 영역에서 노이즈란 목표로 하는 유의미한 정보 이외의 것들이라고 간단히 정의하여 봅니다.앞에서 얘기한 것처럼 자연계는 수많은 노이즈들로 구성되어 있고 우리가 만든 기계들 역시 마찬가지입니다.최적의 결과를 위한 그 나머지, 즉 없애야 할 불필요한 정보를 노이즈라고 규정할 때 그것은 전통과학이찾고자 하는 이성적 결론에 도달하는 좋은 방법일 수 있습니다. 하지만 그것은 단순한 목표를 지향할경우입니다. 오감을 이용한 인간의 총체적 인지를 넘어서려면 노이즈를 배워야 합니다. 여기서 노이즈란비과학적으로 치부되어 온 인간의 영적 능력을 포함하고 있습니다. 인간과 기계의 공생과정에서 우리는이해할 수 없는 인간의 정신영역을 건드려야 합니다.

Friedrich Jürgenson (1903 – 1987) 는 스웨덴 출신의 아티스트였습니다. 1959 년 테이프 녹음기로정원을 새소리를 녹음을 하던 중에 그는 돌아가신 어머니의 목소리를 듣게 됩니다. 이후 그는 페인팅을그만두고 다른 세상의 목소리를 녹음하는데 남은 평생을 바치게 됩니다. 처음에는 마이크를 켜두고 그냥녹음했고 거기서 수많은 언어의 다른 목소리를 듣게 됩니다. 그 목소리들 중의 하나가 조언한 대로 라디오주파수를 1500khz 정도로 맞춰 놓고 조금씩 바꿔가며 그곳을 통해 가끔씩 들리는 귀신같은 목소리들을녹음합니다. 라디오를 이용하기에 음악들이 섞이고 그사이로 묘한 목소리들이 가끔 섞여 나옵니다. 그가남긴 수백개의 테입 중의 일부는 씨디로 발매되기도 하였습니다. EVP(Electric Voice Phenomenon)라고도 하는 이 현상을 당시 유행하던 스피리츄얼리즘이나 신비주의로 치부 할 수 있겠지만 그의 작업에서저는 노이즈란 무엇인가에 대해 다시한번 묻고 싶습니다. 목소리와 메시지를 찾는 이에게 라디오의음악소리와 목소리 중 어느것이 노이즈일까요? 정적 속에서 나타난 목소리들은 일부 학자들이 주장하는것처럼 정말 Friedrich Jürgenson 의 영적인 힘이 테잎에 각인한 소리일까요?(줄리언 제인스는 <의식의 기원>에서 고대인들은 신의 음성을 들을 수 있었다고 합니다. 고대의 인류는어린아이와 같아서 의사결정을 신의 지시로 직접 들을 수 있었는데 인류가 성장하면서 어른처럼 자기주관이생기면서 그 능력이 퇴화되었다고 말합니다. )
김용배 (1952~1986)

"나는 그의 사물놀이 공연을 여러 번 보았지만, 꽹과리에 관한 한 그는 신이다. 그의 꽹과리 소리는 인간이 범할 수 없는어떠한 신적 영역까지 범하고 있다. 꽹과리를 내리치는 그의 손에는 그 요란한 광란의 움직임의 와중에도 관음보살의치맛자락의 선율보다도 더 섬세한 신기가 감돈다."

작고하신 국악명인 김용배선생님의 이야기를 하려고 합니다. 저는 그분의 공연을 실제로 보지 못했습니다.김덕수와 함께 사물놀이라는 실내연주용 놀이형태를 창시한 전설적인 연주자입니다. 김용배선생님의 장구연습 녹음분을 지인을 통해 구할 수 있었고 오디오 머신러닝을 통해 그 분의 연주를 재생성하는 작업을병행하였습니다. 1 시간 남짓의 적은 녹음분량으로 의미있는 학습과 생성이 가능할지 의문이었지만 장구는파형과 음정이 복잡하지 않은 리듬악기라 50 만번의 트레이닝 후 상당히 실연에 근접한 연주를 만들어낼 수있었습니다.
김용배의 연주에 가반한 생성(45초)
들으시는 것처럼 오래된 테입 녹음의 노이즈들이 섞여 있습니다. 이후 가야금 연주 데이터와의 혼합된학습을 통해 아래와 같이 깨끗한 음색의 연주로 재탄생하게 되고 Temperature Modulation 을 통해 약 3초 주기의 연주와 휴지기를 반복하는 음원을 생성할 수 있었습니다.
매우 깨끗한 음질의 장구 소리, 가야금의 땅땅함이 느껴짐 (스네어 드럼과 유사)
다이나믹 코드에 의한 생성. Sine wave, min 0.6, max 1.0 0.3hz, no seed, 가야금+장구(60초)
T 값의 변화에 따른 드론성 휴지기와 장구의 조합. 다이나믹 코드로 연주의 빈도수와 휴지기의 조절이 가능하다.
노이즈일 수 있는 가야금을 섞어 더 깨끗한 장구소리를 도출해내는 머신러닝의 결과물은 디지털 사일런스의오류의 미학을 보여주는 단적인 예라고 할 수 있겠습니다.
맺으며

학습에 기반한 임의적 조합의 연주.우리는 이것을 즉흥연주(improvisation)라고 부르고 수없이 많은 음반과 공연에서 접해왔습니다.오디오머신러닝을 통해 얻어진 연주소리는 길들여진 노이즈의 측면이 있고 들으신 것처럼 길들일 수 없는야생성이 살아 있습니다. 자신의 연주에 내포된 광적인 표현능력을 연주자가 느낄 수 있다면 이 연구의 작은보람이 될 수 있겠습니다. 인간의 영적인 능력은 많은 부분 노이즈로 치부되어지고 과학에 의해 의식되어지지 않고 있습니다. 오류의 미학은 전위적 발상과 새로운 가능성의 출발점이겠지요? 그것이 예술이건,기술이건 간에 노이즈의 영감은 인류의 역사와 함께해 왔습니다. ‘디지털 샤마니즘’ 은 기술을 통해얻어질 수 있는 우리의 원초적 본능과 잠재된 가능성의 출구로 여겨지고 앞으로 머신러닝을 통해 더발전시켜 보려고 합니다.

코로나 바이러스는 인류에게 노이즈일 수 있습니다. 백신으로 정복해야 할, 지구상에 존재하여서는 안될 그무엇이죠. 하지만 이것을 자연의 자정작용으로 이해하는 견해도 있습니다. 과학의 목표가 코로나 박멸일때과학은 공허합니다. 또다른 바이러스가 나타날 것이란 근미래의 묵시록적 암운을 제대로 읽지 못하고 있기때문입니다. 다시 말해 코로나 바이러스를 쓸데없는 노이즈로 치부하는 것은 그것을 제대로 ‘의식’하고있지 않습니다. 노이즈의 추가로 더 나은 결과를 도출할 수 있다는 디지털 사일런스의 명제는 여기에도대입될 수 있습니다.

당신에게 노이즈란 무엇입니까?
© 2024 Byungjun Kwon All rights reserved.
For general inquiries Download CV as PDF
Close