Lấy toàn bộ dữ liệu (DATA) của Blogspot bất kỳ và cách ngăn chặn

Dữ liệu hay data chính là những bài viết, những trang trong blog. Chúng ta có thể lấy được dữ liệu đó là do 1 tính năng mà blogspot cung cấp - RSS - ATOM - Nguồn cấp dữ liệu bài đăng.
Một số người lấy dữ liệu của chính blog của họ để đăng lên site vệ tinh, cũng có một số lười viết bài nên đi ăn cắp dữ liệu của blog khác. Làm sao mà họ làm được điều đó? Dưới đây là câu trả lời:

Bước 1: Xác định tổng số bài viết của blog muốn lấy dữ liệu!


Truy cập http://dxoan.blogspot.com/p/thu-ma-html.html
Copy đoạn code sau, paste vào "Khung nhập mã" rồi ấn "Xem trước nhanh"
<script style="text/javascript">
function showpostcount(json) {
document.write('<center>Tổng số bài: <b>' + parseInt(json.feed.openSearch$totalResults.$t,10)
+ '</b></center>');}</script>
<script src="http://diachi.blogspot.com/feeds/posts/default?alt=json-in-script&callback=showpostcount"></script>
Thay diachi.blogspot.com bằng đường link của blog bạn muốn lấy dữ liệu
Bạn sẽ thấy hiện ra "Tổng số bài" của blog đó. Việc xác định tổng số bài viết này để ta biết lấy dữ liệu từ bài bao nhiêu đến bao nhiêu. Blogspot cho import tối đa 500 bài.

Bước 2: Lấy dữ liệu về máy


Copy đường link dưới:
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=X&max-results=Y

Trong đó:
 diachi.blogspot.com : đường link blog mà bạn muốn lấy dữ liệu
 X: Bài bắt đầu lấy (Lấy từ bài đầu tiên thì X là 1)
 Y: Tổng số bài sẽ lấy tính từ X (Tổng số bài không vượt quá 500)
Ví dụ: Blog muốn lấy dữ liệu có 200 bài viết thì đường link trên sẽ là:
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=200

Để tải dữ liệu về máy bạn có 2 cách:

Cách 1: Sử dụng trình duyệt
Paste đường link đó vào trình duyệt. Chờ load xong thì click chuột phải chọn "Lưu thành". Ta sẽ lưu được 1 file .xml

Ví dụ: Blog muốn lấy dữ liệu có 200 bài thì sẽ thay X=1 và Y=200
Nếu có 1000 bài, thì bạn phải lấy 2 lần. Lần đầu X=1, Y=500 ~> Lưu file .xml; lần sau X=501, Y=1000 ~> Lưu file .xml (Mỗi lần chỉ lấy được 500 bài thôi vì blogspot cho import tối đa 500 bài)

Cách 2: Sử dụng Internet Download Manager (IDM)
Mở IDM lên ~> Ấn "Add URL" ~> Paste link trên vào rồi chọn "OK"

Cuối cùng ấn "Start  Download" để tải file

Bước 3: Nhập dữ liệu (import data) vào blog của bạn


Đăng nhập Blog ~> Cài đặt ~> Khác ~> Ấn Nhập Blog

Chọn file .xml vừa tải về để import lên blog của bạn ~> Ấn Nhập blog

Vậy là coi như đã xong!
Chú ý: Khi import xong nên đăng lấy lệ một vài bài để xóa bỏ Mã Capcha, tránh việc import quá nhiều bài cùng một lúc sẽ bị google cho là spam.
Các bạn cũng không nên import quá nhiều bài của cùng 1 blog cùng 1 lúc (khoảng 4000 bài ~.~), vì làm vậy thì blog của bạn sẽ rất dễ bị xóa. Nên lấy data của nhiều blog, mỗi blog khoảng vài chục bài sẽ tốt hơn.
Mình cũng nói luôn là hành động lấy dữ liệu này không khác gì ăn cắp vậy nên các bạn không nên suốt ngày đi ăn cắp dữ liệu của người khác mà hãy tự tay viết lên những bài viết của mình. Thêm nữa vấn đề về bản quyền tác giả hiện nay cũng rất khắt khe vậy nên các bạn cần cân nhắc kĩ trước khi muốn lấy dữ liệu của blog nào đó.

Cách cài đặt để ngăn chặn và bảo vệ dữ liệu của blogspot


Để tránh bị tình trạng lấy cắp dữ liệu, bạn hãy làm theo những bước sau để tự bảo vệ blog của mình

Đăng nhập blog ~> Cài đặt ~> Khác ~> Tại phần "Cho phép nguồn cấp dữ liệu blog" Chọn "Cho đến dấu ngắt" rồi "Lưu cài đặt" lại

Làm xong như trên thì khi ai đó lấy cắp dữ liệu của blog bạn thì sẽ chỉ lấy được từ đầu bài viết đến phần có dấu ngắt thôi :)
Nếu template bắt buộc phải đặt full data thì ta nên tạo thêm 1 đoạn giới thiệu ,để khi bài viết bị lấy cắp người đọc biết nguồn xuất phát từ đâu. Tại phần "Chân trang nguồn cấp dữ liêu bài đăng" chọn thêm và đánh nội dung vào như hình dưới. (Cái này bạn làm thêm hay không cũng được)
------------------------------------------
Quan trọng:
Bây giờ, mỗi khi đăng bài, bạn cần chèn dấu ngắt nhảy cho bài viết để khi ai đó lấy dữ liệu thì cũng chỉ lấy được đến dấu ngắt là hết.
Cách chèn dấu ngắt nhảy:
Cách 1:
- Đặt con trỏ chuột vào vị trí cần ngắt, tốt nhất là ở sau bức hình đầu tiên hoặc sau 1 đoạn văn ngắn phần đầu.
- Ấn nút "Chèn dấu ngắt nhảy" trên thanh bài viết

Cách 2:
- Chọn chế độ "HTML", thêm code <!--more--> sau bức hình đầu tiên hoặc sau 1 đoạn văn ngắn phần đầu.

Cuối cùng đã xong, chúc các bạn thành công !

DXOan

Đây chính là tôi với sự bùng nổ của những giấc mơ. Tôi thích khám phá và chia sẻ những điều mới mẻ. Hãy đồng hành cùng tôi nhé ! 😁😘😍 - Con đường tôi đi là con đường tôi chọn - 😎😂✌ facebook twitter pinterest youtube external-link

58 Comments

Vui lòng đưa ra những nhận xét tích cực, mang tính xây dựng.*

  1. Nhận xét này đã bị quản trị viên blog xóa.

    ReplyDelete
  2. dùng các thức nhất dễ không cần dùng phần mềm idm - Xem tại : Duy3s.com

    ReplyDelete
  3. Chết thế này bao nhiêu công sức viết bài nó lấy vèo cái là xong á, google làm ăn chán thế

    http://www.songlyricsfinder.info

    ReplyDelete
    Replies
    1. đọc Cách cài đặt để ngăn chặn và bảo vệ dữ liệu của blogspot ở bài viết để không bị lấy data nhé

      Delete
  4. Nhưng làm sao xoá được link những bài viết đó Ad ơi :(

    ReplyDelete
    Replies
    1. Bài viết có link dẫn đến trang người ta hả? Vậy là do người đó dùng cách ngăn chặn và bảo vệ rồi. Giờ còn cách sửa thủ công bằng tay thôi

      Delete
  5. bạn đúng là chuyên luôn, mình hỏi là nếu cài chống copy đến phần ngắt, vậy có ảnh hưởng đến việc tìm kiếm của người khác trên google ko, tức là những từ khóa ở dưới phần ngắt google nó ko xem được đó, cái này mình tưởng tượng ra thôi, nếu sai thì đừng cười nha.

    ReplyDelete
    Replies
    1. ko ảnh hưởng gì đâu, dưới phần ngắt vẫn tìm đc

      Delete
    2. bạn giỏi thế chắc bận việc nhiều mà lần nào cũng reply nhiệt tình, mình đã lik ads của bạn (dĩ nhiên có xem ads lâu, ko phải lik đểu), hi, thank bạn rất nhiều

      Delete
    3. ặc, ko như bạn tưởng đâu, mình max rảnh :v

      Delete
  6. Hay quá cảm ơn ad đã chia sẻ
    www.dangquangad.com

    ReplyDelete
  7. Nhận xét này đã bị quản trị viên blog xóa.

    ReplyDelete
  8. Nhận xét này đã bị tác giả xóa.

    ReplyDelete
  9. tại sao k cài đặt KHÔNG Cho phép nguồn cấp dữ liệu ????????????????????????

    ReplyDelete
    Replies
    1. cài đặt vậy thì làm sao xem được bài viết

      Delete
  10. Nhận xét này đã bị quản trị viên blog xóa.

    ReplyDelete
  11. Nhận xét này đã bị quản trị viên blog xóa.

    ReplyDelete
  12. ad có code nào tự động chuyển hướng về trang gốc nếu bị ăn cắp k.

    ReplyDelete
  13. hay nhỉ, mình gà nhất về blogger vì mới dùng nó, ngày trước sài mã nguồn khác :)
    ---- Bin8.net ----

    ReplyDelete
  14. có cách nào download về xem offline không admin

    ReplyDelete
  15. thanks ad lấy bộ dữ liệu dât của blogspot bất kỳ more: cờ bạc bịp mới nhất

    ReplyDelete
  16. Nhận xét này đã bị quản trị viên blog xóa.

    ReplyDelete
  17. Cảm ơn admin nhiều nhờ vậy mất công viết bài lại :)
    Click here >> chợ chatuchak vận chuyển hàng thái lan đá khô co2
    ban nhac cu

    ReplyDelete
  18. Quá đỉnh cho code trên, content copy thì dùng DMCA mà chặn Google và DMCA đọc hiểu mà các bác.
    nấm lim xanh tự nhiên
    Cây an xoa chữa bênh gan
    sâm ngọc linh ngâm rươụ

    ReplyDelete
  19. This comment has been removed by a blog administrator.

    ReplyDelete
  20. This comment has been removed by a blog administrator.

    ReplyDelete
  21. This comment has been removed by a blog administrator.

    ReplyDelete
  22. Nhận xét này đã bị tác giả xóa.

    ReplyDelete
  23. Nếu dữ liệu bài viết trên blog đã được Google index, có nghĩa là Google đã xác định bài viết đó do mình tạo ra, khi đó việc copy dữ liệu không có nhiều ý nghĩa, thậm chí ảnh hưởng xấu đến các web copy. Mình cũng sẽ không bị ảnh hưởng gì cả

    ReplyDelete
  24. This comment has been removed by a blog administrator.

    ReplyDelete
  25. This comment has been removed by a blog administrator.

    ReplyDelete
  26. the nay thi mat cong toi roi
    thanhcadu.com

    ReplyDelete
  27. Nhận xét này đã bị tác giả xóa.

    ReplyDelete
  28. Nhận xét này đã bị tác giả xóa.

    ReplyDelete
  29. This comment has been removed by a blog administrator.

    ReplyDelete
  30. Cảm ơn bạn đã chia sẻ bài viết thật tuyệt vời.

    duraflex
    Rockwool
    Thi công chống cháy lan

    ReplyDelete
  31. This comment has been removed by a blog administrator.

    ReplyDelete
  32. This comment has been removed by a blog administrator.

    ReplyDelete
  33. Bài viết rất hay và hữu ích .cảm ơn bạn đã chia sẻ.
    mọi người tham khảo thêm mẫu ghế mới nhất ở đây nha
    ghế massage giá rẻ
    giá ghế massage

    ReplyDelete
  34. This comment has been removed by a blog administrator.

    ReplyDelete
  35. This comment has been removed by a blog administrator.

    ReplyDelete
  36. Chất quá bác ơi, có bài hướng dẫn như này, giờ chỉ cẩn thận tý nữa là yên tâm làm rồi...
    NHẬN ĐỊNH KÈO BARCELONA VS SOCIEDAD –17/12/2020- LA LIGA Trực tiếp bóng đá k+ (link hiện trước trận 30p) KQBD 7M

    ReplyDelete
  37. This comment has been removed by a blog administrator.

    ReplyDelete
  38. This comment has been removed by a blog administrator.

    ReplyDelete
  39. This comment has been removed by a blog administrator.

    ReplyDelete
Previous Post Next Post

AdBlock Detected!

Phát hiện trình duyệt đang sử dụng AdBlock. Vui lòng tắt AdBlock để có thể xem nội dung cũng như ủng hộ tác giả. Ducxoan.com xin cảm ơn. Chúc bạn một ngày vui vẻ !