자연어처리 데이터 준비
대학교 과제 준비용 자연어 처리 작업을 하기 전에 필요한 데이터 크롤링 작업 준비 크롤링이란 크롤링은 웹 페이지를 그대로 가지고 와서 데이터를 추출해 내는 것을 의미한다. 크롤링을 하는 방법? 자연어 처리 사전작업을 하기 위해(전처리) 학교에서 파이썬을 사용하였기에 나는 파이썬을 이용해, Beautiful Soup, selenium를 사용...
대학교 과제 준비용 자연어 처리 작업을 하기 전에 필요한 데이터 크롤링 작업 준비 크롤링이란 크롤링은 웹 페이지를 그대로 가지고 와서 데이터를 추출해 내는 것을 의미한다. 크롤링을 하는 방법? 자연어 처리 사전작업을 하기 위해(전처리) 학교에서 파이썬을 사용하였기에 나는 파이썬을 이용해, Beautiful Soup, selenium를 사용...
이제 제대로 성공한 방법을 살펴보기로 하자. 다음번에 하려고 하면 또 까먹을 듯 하여 저장하는 글. 기본 시작 준비 시작하기에 앞서 준비물들을 살펴보자. 1.1 텍스트 에디터 선택 어떤 텍스트 에디터를 사용해도 좋으나 나는 지금까지 써봤던 것중 vscode가 가장 마음에 들기에 이것을 사용하기로 하였다. 1.2 github 회원가입하기. ...
마크다운 사용하는거 저장소 ========= = 제목 -——– = 부제 <br/> = 줄바꿈 # 1 = 주 표시 ## 1 = 부표시 ### 1 = 부부표시 등등 \ = 한 칸 띄우기 `````` = 코드 입력 1 <pre><code></code></pre> ...
코드 입력 테스트 아래는 자연어 처리 토큰화 후에 토큰에 아이디 부여하는 작업 for comment in naver_review: tokens = tokenizer.morphs(comment) tokenized_comment.append(tokens) all_tokens = all_tokens+tokens 위가 <...
첫 포스팅 테스트인데 이거 왜 포스팅이 11월 01일이지 난 분명히 10월 31일에 했는데 흠… 그리고 해결 site.posts를 지운 후 date를 설정하였음 --- title: 첫 테스트 date: 2023-10-31 00:00:00 +09:00 categories: [메인, 서브] tags: [태그 테스트1] pin: true ---
드디어 성공했다… 이번 포스트 에서는 탈 많고 일 많았던 github.io페이지 만들기를 설명하기로 하자. 1. 시작하게 된 계기 1.1 저장소 지금까지 계속 이것저것 공부는 해 보겠다고 수박 겉핥기는 많이 해본 것 같은데 생각해 보니 결국 다른걸 공부하면 머리속에서 거의 없어졌다는 것을 꺠닫고 기록을 하기로 했다. 1.2 어떤 보관소가 좋...
호롱고양이의 개발일지 대학생이자 휴학생이며 곧 나라의 부름에 따라 군대를 다녀오겠지만 사회 복무원이 될 원하는 것은 전부 공부하고 있는 고양이 ᓚᘏᗢ
시작에 앞서 이젠 확실하게 권한상승까지 있는 Tier 2 문제를 풀어보자. 근데 어째 권한상승은 할만한데 초기 침투가 좀 많이 어려운… 이름 난이도 OS Link Archetype Very Easy Windows Lin...
발표까지 완료! HTB_Facts_호롱고양이.pptx 시작에 앞서 오랜만에 여행을 다녀온 후 진행한 HTB 문제풀이다. 그것도 이번엔 놓치지 않고 Season 10에 나온 문제들을 풀기 시작했다. 이미 늦게 시작한 듯 하긴 하다만. 이번 문제는 Linux이며 권한 상승은 정말 간단하고 쉬웠지만, 이상하리마치 유저 획득에서 좀 많...
시작에 앞서 저번에 이어 이번주는 StartingPoint에 있는 tier1 문제인 Fundamental exploitation 문제를 풀도록 하겠다. 이번건 근데 왜 Very Easy인지 모르겠는 문제도 있네..? 이름 난이도 OS Link App...