//광고차단회복
반응형

보안뉴스 크롤링으로 메인 메뉴 크롤링 하기


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
import pandas as pd
 
from bs4 import BeautifulSoup as bs
 
import urllib.request as req
 
 
 
 
 
url = "https://www.boannews.com/default.asp"
 
res = req.urlopen(url)
 
soup = bs(res,"html.parser")
 
 
 
a_list = soup.select("#main_menu_hash >  a")
 
 
 
for a in a_list :
 
    name = a.string
 
    print("-",name)
 
 
 
#print( a_list )
cs


반응형

'프로젝트' 카테고리의 다른 글

보안뉴스 웹크롤링(5)  (0) 2020.08.06
보안뉴스 웹크롤링(4)  (0) 2020.08.05
보안뉴스 웹크롤링(3)  (0) 2020.07.16
보안뉴스 웹크롤링(2)  (0) 2020.07.15
반응형

HTML이란?

 HTML은 HyperText Markup Language의 줄임말로 '초월한'의 뜻인 Hyper와 '글'을 의미하는 Text가 합쳐져 일반적인 글과 다르게 링크를 통해 구성된 문서인 HyperText와 태그 등을 이용하여 데이터의 구조를 표시하는 Markup, 언어를 뜻하는 Language가 합쳐져 있는 단어입니다. 즉, 웹을 구성하기 위해 웹 문서를 만드는 언어로 이야기할 수 있습니다. 

HTML은 웹 문서를 만들기 위한 마크업 언어입니다. 프로그램을 만들기 위한 프로그래밍 언어가 아닙니다


HTML 예시

 우리가 구글이나 네이버에 들어가서 F12를 누르거나 마우스 우클릭 -> 페이지 소스 보기를 클릭해보자

구글의 html
네이버의 html

두 개의 대표 사이트에서 볼 수 있드시 HTML은 html 버전을 알려주는 <!doctype>과 <html><head><body>태그로 기본을 이루고 있다. 

<!doctype html> <!-- html 버전을 알리는 태그 -->
<html>	        <!-- html, 즉 웹문서를 시작하는 태그>
    <head>      <!-- head, 브라우저에 필요한 정보를 적는 태그 -->
    </head>	<!-- head 태그를 닫기>
    <body>      <!-- body, 우리가 보는 페이지를 구성하는 태그> 
    </body>     <!-- body 태그 닫기-->
</html>         <!-- html 태그 닫기 -->

HTML 태그 정리

 <html> </html>  웹 문서의 시작과 끝을 알리는 태그
 <head> </head>  브라우저에 필요한 정보를 적는 태그 
 <title> </title>  제목 표시줄에 표시될 제목을 적는 태그
 <meta>  문서에 필요한 문자 인코딩, 정보를 적는 태그
 <body> </body>  웹 문서에서 브라우저에 보여질 내용을 적는 태그
 <hnum> </hnum>  제목 텍스트 입력하는 태그, num에는 1부터 6까지 들어갈 수 있으며 숫자가 클수록 크기가 작다
 <p> </p>  텍스트 덩어리를 단락으로 묶어 보여주는 태그
 <br>   단락 안에서 줄바꿈을 하기 위해 사용하는 태그
 <hr>  수평줄을 넣는 태그 (가로선이 기본)
 <blockquote> </blockqoute>  인용하는 내용을 넣는 태그, 인용문은 원래의 글보다 작게 표시됨

 

반응형

'' 카테고리의 다른 글

dreamhack Quiz: Cookie & Session  (0) 2022.09.17

+ Recent posts