728x90
텍스트를 입력하면 이미지를 만드는 AI를 응용해, 스펙트로그램(spectrogram) 이미지를 먼저 만든 다음 다시 소리로 바꾸는 사례가 나왔습니다.
https://www.riffusion.com (데모 페이지)
https://www.riffusion.com/about (소개, 영어)
스펙트로그램은 소리를 시각화한 것으로 여기서 x축은 시간, y축은 주파수를, 픽셀의 색상으로 진폭을 나타낸다고 합니다.
음악을 만드는 AI는 앞서 Dance Diffusion이나 Jukebox 같은 것들이 나왔기 때문에, Riffusion이 최초는 아닙니다. 개발자들도 몇 분짜리 음악을 만드는 목표가 아닌, 이런 방법으로도 곡을 만들 수도 있다는 걸 보여주기 위해 취미로 만들었다고 설명했습니다.
* 관련 Ars Technica, TechCrunch 기사
- Riffusion’s AI generates music from text using visual sonograms
- Try ‘Riffusion,’ an AI model that composes music by visualizing it
https://techcrunch.com/2022/12/15/try-riffusion-an-ai-model-that-composes-music-by-visualizing-it/
그럼,
공유합니다.
728x90
'개발 이야기 > AI 인공지능 이야기' 카테고리의 다른 글
chatGPT 활용 방안 가능성 (0) | 2023.01.30 |
---|---|
챗봇과 일반 웹 검색을 혼합한 새 검색엔진 Andi (0) | 2023.01.29 |
이미지 AI Stable Diffusion 2.0 공개돼 (0) | 2022.11.25 |
흑백 사진을 컬러로 바꿔주는 AI 사이트 나와 (0) | 2022.10.22 |
MS, 자사 앱에 AI 이미지 생성 프로그램 'DALL-E 2' 추가 (0) | 2022.10.13 |