[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Cái gì của ta thì để Google giữ...



On Fri, 19 Sep 2014 03:01:23 -0700 (PDT)
Võ Hoàng Sang <[email protected]> wrote:

> Hổng biết anh mún lấy dữ liệu của GG làm gì vì em thấy nó lưu trữ
> cũng ok mà tìm cũng dễ. Nếu sợ group bị mất thì chắc lúc đó em cũng
> già lụ khụ rồi :)

Còn một vấn đề nữa, là `gửi chéo`, tức là một thư gửi vào nhiều nhóm
thư khác nhau. Sau một hồi thảo luận thì thư sẽ bị lạc, nghĩa là người
gửi (vô tình || cố ý) gửi vào chỉ một trong các nhóm thư chứ không phải
tất cả nhóm như ban đầu.

Hậu quả là trong phần `archive` sẽ bị vụn ra, không rõ chủ đề gốc ở đâu.

Ví dụ: thư đầu tiên của archlinuxvn mà google lưu là [1] (để ý
message ID ở đây là 00000). Nhưng thực ra chủ đề gốc là [2] (mình
mới thêm vào, message ID là 02551)

Làm thế nào để giải quyết? Mình dùng [3] lấy cả hai kho SaigonLUG và
ArchLinuxVn về, viết vài vòng lặp để so sánh, rồi chuyển qua. 

Bây giờ thì http://l.archlinuxvn.org/archlinuxvn/ đã khá đầy đủ, mặc
dù vẫn còn thiếu ít nhất 3 + 6 = 9 thư không rõ là đi phương trời nào
(3: follow-up, 6: not-available.)

Các bạn thấy đó, sở thích của mình là ... đảm bảo rằng cái gì đã
xuất bản trên web rồi thì nó sẽ còn lại dù có bão tố lụt lội gì hè hè.
Và nhờ đó, có đầy đủ bằng chứng [4] là Long Già đã bị mình xúi dại dùng
ArchLinux vào ngày 26/5/2006 lolz


[1] http://l.archlinuxvn.org/archlinuxvn/msg00000.html
[2] http://l.archlinuxvn.org/archlinuxvn/msg02551.html
[3] https://github.com/icy/google-group-crawler
[4] http://2005.viettug.org/thread.2237.html

--
I am ... 5.5 dog years old.