본문 바로가기

728x90

개발 이야기/AI 인공지능 이야기

(87)
이미지 AI Stable Diffusion 2.0 공개돼 텍스트를 이미지로 변환하는 AI Stable Diffusion의 2.0 버전이 공식적으로 발표와 동시에 소스가 공개되었습니다. https://stability.ai/blog/stable-diffusion-v2-release https://github.com/Stability-AI/stablediffusion 2.0에서 바뀌었다는 내용 요약 - 새로운 텍스트 인코더로 훈련된 강력한 Text-to-Image 변환 모델 탑재 - 512x512 또는 768x768 픽셀 해상도로 생성 가능 - 이미지 해상도를 4배 향상하는 업스케일러(Upscaler), Text-to-Image 모델과 결합하면 2048x2048 이상 해상도로도 가능 - Depth2Img : 이미지의 심도(Depth) 정보를 파악해서, 텍스트와 심..
흑백 사진을 컬러로 바꿔주는 AI 사이트 나와 스웨덴 출신의 머신러닝 연구자가 흑백 사진의 색을 추측, 자동으로 컬러로 바꿔주는 AI 사이트를 만들었습니다. https://palette.fm/ - 회원 가입 같은 절차 없이 사진만 바로 올리면 됩니다. - 사진을 올리면 여러 필터가 나타나고, 혹시 필터 중에 마음에 드는 게 없으면, 연필 아이콘을 클릭해 프롬프트(prompt)를 입력할 수 있습니다. - 일단 지금은 무료 서비스인데 유료화 계획도 있다고 합니다. - 올린 사진은 저장하지 않는다고 합니다. 그렇지만 다른 클라우드 서비스처럼, 대외 노출에 민감한 사진은 올리지 않는 것을 추천합니다. Palette.fm 화면 □ 관련 해외 기사 - AI tool colorizes black-and-white photos automatically | Ars ..
MS, 자사 앱에 AI 이미지 생성 프로그램 'DALL-E 2' 추가 (기사 중 일부 문단 인용) - 마이크로소프트의 빙(Bing)과 에지(Edge) 브라우저의 이미지 크리에이터는 DALL-E 2 기능을 수주 이내로 출시할 예정이다. 초기에는 특정 지역에서만 프리뷰 버전으로 출시하며, 추후 사용자의 피드백 수집 후 배포 범위를 확장할 계획이다. - 이미지 크리에이터는 무료로 출시돼, 일각에서는 DALL-E 2 기능의 악용 가능성을 지적한다. 실제로 이미 DALL-E 2와 같은 AI 이미지 생성 프로그램이 폭력적 이미지나 포르노 이미지 제작에 악용된 사례가 보고된 적이 있기 때문이다. - 이에, 마이크로소프트 측은 잠재적인 악용 우려를 검토한 뒤 이미지 생성 기능을 추가했다고 밝혔다. …… □ 출처 : 코딩월드뉴스 https://www.codingworldnews.com/n..
“키워드 입력하면 AI가 광고 카피 써준다”…카카오브레인, 한국어 특화 초거대 AI 모델 공개 * 공식 https://developers.kakao.com/product/kogpt 카카오브레인 KoGPT API는 제시된 한국어를 사전적, 문맥적으로 이해하고 사용자의 의도에 맞춘 문장을 생성해 제공합니다. GPT-3 기반 언어 모델인 KoGPT를 활용하여, 주어진 문장의 긍정과 부정 판단, 내용 요약 또는 결론 예측, 질문에 대한 답변, 다음 문장 작성 등 한국어와 관련된 모든 과제를 수행할 수 있습니다. 다양한 분야에서 기계 독해, 기계 번역, 작문, 감정 분석 등 높은 수준의 언어 과제를 해결하기 위해 활용해 보세요. * 제목은 경향신문 기사에서 가져왔습니다. https://www.khan.co.kr/economy/economy-general/article/202210131108001 https..
구글, 동영상 만드는 AI 'Imagen Video' 발표 최근 AI와 관련된 경쟁이 치열해지고 있습니다. 며칠 전 메타에서 먼저 Make-A-Video를 발표한 것에 이어, 구글도 텍스트 입력을 받아 동영상을 만드는 AI 'Imagen Video'를 발표했습니다. 텍스트 입력을 저해상도(24*48px/3fps, 16프레임) 동영상으로 만든 후 높은 해상도(1280*768/24fps)로 업스케일링 하는 방식이라고 합니다. https://imagen.research.google/video/ 역시 구글 연구원들이 만든 Phaneki https://phenaki.github.io/ 라는 또 다른 모델도 발표되었습니다. Imagen Video가 5초 정도 짧은 영상이라면 이건 좀 더 긴 문장을 입력해서 2분 정도의 조금 더 긴 영상을 만들 수 있다고 합니다. 현재는 두..
메타, 동영상 만드는 AI 'Make-A-Video' 발표 메타가 문장을 입력하면 내용에 맞는 동영상을 만드는 AI Make-A-Video를 발표했습니다. https://makeavideo.studio/ ↑ 5초 정도 짧은 길이에 소리는 없지만 여러 결과물이 올라와 있습니다. 메타는 이 AI가 크리에이터나 아티스트에게 중요할 도구가 될 것이라고 기대하고 있습니다. 다만 DALL-E 같은 이미지를 만드는 AI와 마찬가지로 가짜 영상을 만드는 데 쓰이거나 딥페이크 같이 디지털 성범죄 문제와 연관될 우려도 있습니다. 메타 쪽도 새로운 AI 시스템을 만드는 것에 신중하고 싶다(thoughtful)면서 지금은 연구 논문만 올린 상태입니다. 데모도 공개할 예정이라고 하는데, 아직 공개 시기나 모델 접근 제한 사항 등은 밝히지 않았습니다. □ 자기 자신을 그리는 테디베어 □..
최신 AI 사용법 왕초보 실전 가이드 (ft. Stable Diffusion) 요즘 가장 핫한 Stable Diffusion을 함께 소통하며 직접 실전 결과물을 만들며 배우고 사용해볼 수 있습니다. 텍스트로 원하는 이미지를 입력하면 입력된 텍스트에 따라 새로운 이미지를 만들어 줍니다. https://www.youtube.com/watch?v=vVdNmnEb--E 실습하기 https://github.com/AUTOMATIC1111/stable-diffusion-webui Colab (업데이트됨 아래 주소 이용) https://colab.research.google.com/drive/1kw3egmSn-KgWsikYvOMjJkVDsPLjEMzl 가이드북 https://dallery.gallery/the-dalle-2-prompt-book/ lexica 키워드(prompt) 참고용 htt..
'원하는 만큼만 GPU 쓴다'…KT, '하이퍼스케일 AI 컴퓨팅' 출시 KT는 클라우드 기반의 그래픽처리장치(GPU) 인프라 제공 서비스 ‘하이퍼스케일 인공지능(AI) 컴퓨팅’을 출시했다고 10일 밝혔다. 이는 올해 10월 밝힌 AI 인프라 솔루션 전문기업 ‘모레’와의 협력 결과다. ‘하이퍼스케일 AI 컴퓨팅’은 국내 최초로 고비용의 GPU 인프라를 동적 할당 방식으로 제공하는 실 사용량 기반 종량제 서비스다. AI 서비스 전문기업 또는 AI 개발자 등은 GPU 자원을 원하는 시점에 원하는 만큼만 할당 받아 사용하고 이후엔 반납하면 된다. 실제 개발과정에서 GPU는 개발기간 전체에 필요하지 않고 데이터 분석, 모델학습 등에만 활용된다. 이 서비스를 이용하면 GPU를 필요한 기간에만 사용할 수 있어 개발비용을 대폭 절감할 수 있다. AI 응용 서비스 개발을 위한 데이터 분석 ..

728x90