분류 전체보기
-
[DACON] 한국어 문장 관계 분류 w/KoBART개발/머신러닝-딥러닝 2022. 6. 2. 11:31
DACON 대회 한국어 문장 관계 분류 경진대회 - DACON 좋아요는 1분 내에 한 번만 클릭 할 수 있습니다. dacon.io KoBART를 이용한 한국어문장 학습을 공부하다가 실습하면서 해보면 좋을 것 같아서 선정했다. 코드공유란의 아래 코드를 참고해서 작성했다 Hugging Face를 활용한 Modeling(public: 0.841) 한국어 문장 관계 분류 경진대회 dacon.io 0. 목표 문장1과 문장2의 관계에 대해서 정확하게 분류하는 것. Label은 참, 거짓, 중립이 있다. 1. 데이터 확인 Train_set에는 문장 두 개와 label이 있으며, Test_set에는 문장 두개가 있다. Train_set에는 약 25000개의 데이터가 존재한다. 2. 데이터 처리 데이터에서 한글과 숫자만..
-
[책 리뷰] 시장을 풀어낸 수학자 - 그레고리 주커만리뷰/책 리뷰 2022. 5. 4. 01:32
시장을 풀어낸 수학자 - 그레고리 주커만 1세대 퀀트 투자기업 중 가장 큰 성공을 이루었다고 여겨지는 르네상스의 짐 사이먼스의 인생을 담은 책. 퀀트 투자의 방법이나 전략 등이 나와있지는 않지만 퀀트 투자가들이 어떤 사람들이고, 어떤 마음가짐으로 시스템을 구축하는지 보여주는 책이다. 문장 돈은 과학자와 수학자에게도 매혹적인 존재다. 그렇게 많은 돈을 벌어들이는 것을 한 때 부끄러워했던 직원들까지 포함해 르네상스 직원들은 서서히 자신들의 승리를 즐기기 시작했다. → 수학을 돈을 버는 데 사용한다고 비판했던 수학자, 과학자들도 돈을 많이 벌어보니 생각을 바꿔먹게 되는 것을 보면서 정말 돈과 지위에 어떠한 힘이 있는 것이 아닐까 하는 생각을 했다. 사이먼스는 돈이 곧 힘이라는 사실을 어린 나이에 깨달았습니다...
-
[운영체제] 스레드개발/OS 2022. 4. 12. 23:31
스레드 프로세스의 실행 단위라 할 수 있다. 스레드는 생성시 스택영역만 독립적으로 할당받고, 나머지는 프로세스의 것을 공유한다. 스택은 함수의 인자, 지역변수, 리턴 값 등을 저장하는 메모리 공간이므로 스택을 독립적으로 할당하여 스레드별로 독립적인 함수 호출 및 실행이 가능하다. 또한 각 스레드는 스케쥴러에 의해서 실행과 대기가 반복되는데, 다시 시작될 때 실행할 지점을 찾기 위해서 PC가 독립적으로 할당된다. 멀티 스레드 장점 하나의 프로세스 안에서 여러 작업을 동시에 처리할 수 있기 때문에, 시간과 자원적으로 이득 스레드끼리 메모리공간(코드, 데이터, 힙 등)을 공유하기 때문에, 데이터의 교환이 쉽다. context switch시 캐시 메모리를 초기화 해줄 필요가 없기 때문에, 프로세스의 것보다 빠르..
-
[운영체제] 프로세스개발/OS 2022. 4. 11. 00:30
프로세스 실행중인 상태의 프로그램을 프로세스라 한다. 프로세스는 각각 독립된 주소공간을 할당받으며 각 메모리는 정해진 영역을 가지고 있다. 코드 - 코드 자체를 구성하는 영역 데이터 - 전역 변수, 정적 변수, 배열 등을 저장하는 영역 스택: 지역변수, 매개변수, 리턴값을 저장하는 영역 힙: malloc이나 new와 같이 메모리를 동적 할당 시 사용되는 영역 스택과 힙은 같은 공간을 공유하며, 서로의 공간을 침범할 경우 오버플로우가 일어난다. 프로세스의 상태 프로세스는 실행되는 동안 상태가 바뀐다. 멀티 프로세스 하나의 컴퓨터에 여러 CPU를 장착해 여러 프로세스가 하나의 프로그램을 병렬적으로 처리할 수 있다. 이 경우 몇몇 프로세스가 오작동해도 프로그램을 정상 동작할 수 있으므로 안정성이 확보된다. 프..
-
[책 리뷰] 당신 인생의 이야기 - 테드 창리뷰/책 리뷰 2022. 4. 6. 01:13
당신 인생의 이야기 - 테드 창 영화 [컨택트]의 원작 소설이 들어있는 단편집. 컨택트와 비슷한 퀄리티의 단편이 8개 들어있다. 작가의 몽상, 특히 과학적 몽상이 여러가지 들어있는 단편집이다. 문장 각자가 거의 정반대의 접근법을 채택하고 있기는 했지만, 양쪽 모두 동일한 물리적 우주를 기술하는 시스템이었기 때문이다. -네 인생의 이야기- 자신이 신의 의식 너머에 존재함으로써 신에게 사랑받고 있지 않다는 사실조차 알고 있지만, 이것도 그의 감정에는 아무런 영향도 끼치지 못한다. 무조건적인 사랑은 아무것도 요구하지 않기 때문이다. 그리고 신의 의식 너머에서 오랜 세월을 지옥에서 살아온 지금도 여전히 신을 사랑하고 있다. 진정한 신앙이란 본디 이런 것이다. -지옥은 신의 부재- 하지만 아름다움이란 일종의 마법..
-
[책 리뷰] 인간관계론 - 데일 카네기리뷰/책 리뷰 2022. 4. 3. 00:30
인간관계론 - 데일 카네기 인생을 살아가며 적절한 인간관계를 맺기 위한 방법이 적혀있는 책. 상대의 호감을 얻고, 설득하고, 변화시키는 다양한 방법을 제시하고 그와 관련된 사례들을 제시한다. 자기계발서의 부동의 원탑. 문장 인간 본성에서 가장 근본적인 원리는 인정받으려는 갈망이다. 그러나 모든 인간은 마음으로는 이상주의자이기 때문에 그럴듯해 보이는 동기 역시 고려하고 싶어하고, 따라서 사람을 변화시키고 싶다면 바로 그 고상한 동기에 호소해야 한다. → 상대의 행동을 바꾸고 싶다면 대외적인 이미지를 챙겨주자! 지금은 연출 시대다. 때문에 어떤 사실을 그저 말하는 것만으로는 충분하지 않고, 그것을 생생하고 재미있으며 극적으로 연출해야만 한다. 당신은 쇼맨십을 발휘해야만 한다. 영화나 라디오, TV에서도 그렇..
-
[알고리즘] 플로이드-워셜 알고리즘개발/자료구조와 알고리즘 2022. 3. 24. 00:40
플로이드-워셜(Floyd-Warshall) 알고리즘 그래프의 모든 노드 간 최단 거리를 구하는 알고리즘이다. 시간 복잡도는 $O(n^3)$이므로 모든 최단 경로가 필요하지만 노드의 수가 적을 때 사용할 수 있다. 아이디어 한 노드(k)가 다른 두 노드(a, b)의 중간지점이라 생각한다면, a에서 b로 가는 경로는 $a-k-b$ 이다. (k가 a혹은 b라면 경로는 a-b가 된다.) $a-k-b$를 모두 조사한다면 a-b간 최단 경로를 알 수 있다. 아래와 같은 그래프를 가정하면 2를 중간 노드로 둘 경우, 2-2-3, 2-2-5, 3-2-5의 세 가지 경로의 값을 알 수 있다. 이 값들 중에서 3-2-5의 경우 3-5로 가는 경로보다 값이 작으므로 업데이트 해준다. 코드 for k in range(1, n..
-
[논문] CNN - AlexNet, 2012개발/머신러닝-딥러닝 2022. 3. 8. 18:01
제가 이해한 내용을 정리한 글입니다. 오류가 있으면 고쳐주세요! 2012년에 CNN을 사용해 ILSVRC에서 압도적으로 1등한 모델. 기반이 되는 논문은 AlexNet 이다. 배경 기계학습의 성능을 높이기 위해서는 큰 데이터셋이 필요하다. 큰 데이터를 잘 학습하기 위해서는 용량이 큰 모델이 필요하다. CNN은 비슷한 규모의 피드포워드 신경망보다 간선과 파라미터가 적으므로 학습이 쉽다. (물론 best-perfomance는 조금 떨어질 수 있다.) 모델 특징 모델은 이미지의 속성을 찾는 5개의 Conv층과 속성으로 이미지를 분류하는 3개의 FC층이 있다. 여기서 Conv층을 조금이라도 제거한다면 성능이 떨어짐을 확인했다. 두 개의 GPU - 피드포워드 신경망보다 적지만 여전히 GPU로 학습하기에는 용량이 ..