Idea & Issue
-
AUTO LABELING(3)_액티브 러닝이란?Idea & Issue/기술 리뷰 2024. 6. 9. 00:02
액티브 러닝의 개념전통적으로 기계학습(Passive Machine Learning)은 라벨링되지 않은 데이터에 대해 사람이 라벨을 부여하면 이를 기계가 학습하는 방식으로 이루어졌다. 이 방식에서는 학습 데이터 마련에 상당한 사람의 공수가 들어간다. 뿐만아니라 이미지넷 리더보드나 기계번역 모델을 보면 사람보다도 태스크를 잘 수행하는 모델이 등장하였는데, 이렇게 잠재적으로 뛰어난 기계를 두고 사람이 모든 라벨링을 진행하는 것은 조금 아깝다는 생각이 든다. 어떤 데이터가 필요한지를 기계가 판단하여 사람에게 라벨링을 부탁하면 사람은 더 적은 라벨링 공수를 들이고도 좋은 모델을 학습할 수 있지 않을까?이것이 액티브러닝의 아이디어다. 액티브러닝에서는 기계가 라벨링이 필요한 데이터 중 자동적으로, 그리고 점진적으로 ..
-
AUTO LABELING(2)_국내 솔루션 사례Idea & Issue/기술 리뷰 2023. 6. 7. 17:34
국내에도 데이터 라벨링 작업을 지원하기 위한 다양한 솔루션 업체와 서비스가 존재합니다. 그 중에서도 ‘데이터 라벨링 플랫폼’의 형태로 ‘협업’을 지원하는 서비스에 자동화/반자동화 라벨링 시스템을 포함시키는 형태로 제공하고 있습니다. 👉 기술 소개에 앞서, 오토라벨링에 관한 용어를 정리하고 갈 필요가 있습니다. 현재 오토라벨링의 기술적 정의가 명확하지 않아 서비스를 오해하게 되는 경우가 많았기 때문입니다. 반자동화 라벨링 라벨링 과정에서 박스, 폴리곤, 경계선 등의 생성작업을 도와주는 것을 지칭합니다. 대표적으로 포토샵의 ‘자동 누끼’ 기능이 있습니다. interators(세그먼트)/Detectors(객체탐지)/Trackers(객체추적) 등의 형태로 라벨링 작업을 간소화합니다. ‘스마트 라벨링/오토 폴리곤..
-
AUTO LABELING(1)_개념Idea & Issue/기술 리뷰 2023. 6. 7. 17:31
✔ 오토라벨링 개념 오토라벨링은 기계 학습 모델을 훈련시키기 위해 사용되는 자동 레이블링 기술 사전에 정의된 규칙이나 알고리즘을 사용하여 데이터에 자동으로 레이블을 할당 예를 들어, 이미지 분류 작업을 수행한다고 가정해봅시다. 오토라벨링을 사용하면 모델에게 입력된 이미지에 대해 자동으로 레이블을 지정할 수 있습니다. 이를 위해 사전에 훈련된 모델이 이미지의 특징을 학습하고, 이러한 특징을 기반으로 이미지를 분류하는 방식을 사용합니다. 📌 특정 태스크에 대해 사전에 학습된 모델(Pre-trained model)을 라벨링 작업에 투입시켜 자동화 과정을 수행하는 기술 [Technology Toolkit 2021] 2. 데이터 줄게, 레이블링 [해]다오 Auto Labeling | 인사이트리포트 | 삼성SDS ..
-
ChatGPT - 시 작성해보기Idea & Issue 2022. 12. 14. 14:23
최근 OPEN-AI의 chatgpt 서비스를 통해 다양한 대화가 가능하여, 시를 작성해보았다.
-
-
Random_state = 42Idea & Issue 2022. 12. 6. 15:24
데이터 전처리를 하거나 머신러닝 모델을 만들다보면, random_state 라는 매개변수를 자주 접하게 된다. 해당 변수는 사용자가 동일한 시드의 랜덤 데이터를 얻어내기 위한 것이다. 다른 사용자가 동일한 프로세스를 따르더라도 추출된 데이터가 다른다면 결과가 달라 질 수 있기때문이다. 그런데 여기서, '42'라는 숫자를 자주 사용하는 경우가 있는데 그 이유가 무엇일까? 결론부터 말하자면 특정값을 쓰는데에는 아무런 의미가 없다. 그럼에도 42라는 숫자가 자주 쓰이는 것은 일종의 '밈'이라고 할 수 있다. 영국 작가 더글러스 애덤스의 SF소설 "은하수를 여행하는 히치하이커를 위한 안내서"에 등장하는 한 외계 종족은 삶과 우주, 세상 만물에 대한 답을 구하기 위해 슈퍼컴퓨터 '딥소트(Deep Thought, ..
-