إذا سبق لك استخدام واجهات الويب لعرض السجلات ، فمن المحتمل أنك لاحظت مدى تعقيد هذه الواجهات ، وكقاعدة عامة ، و (غالبًا) ليست مريحة للغاية ولا تستجيب. يمكنك التعود على البعض ، والبعض الآخر سيء للغاية ، ولكن يبدو لي أن سبب كل المشاكل هو أننا نتعامل مع مهمة عرض السجلات بشكل غير صحيح: نحن نحاول إنشاء واجهة ويب حيث تعمل واجهة سطر الأوامر CLI بشكل أفضل. أنا شخصيًا مرتاح جدًا للعمل مع tail و grep و awk وغيرها ، وبالتالي بالنسبة لي فإن الواجهة المثالية للعمل مع السجلات ستكون شيئًا مشابهًا لـ tail و grep ، ولكن في نفس الوقت يمكن استخدامها لقراءة السجلات التي تأتي من العديد من الخوادم ... هذا ، بالطبع ، اقرأها من ClickHouse!
* حسب الرأي الشخصي للمحتال انت صخرة
تلبية logscli
لم أتوصل إلى اسم لواجهتي ، ولكي أكون صادقًا ، فهو موجود كنموذج أولي ، ولكن إذا كنت تريد رؤية المصدر على الفور ، فمرحبًا: https://github.com/YuriyNasretdinov/logscli (350 سطرًا من كود Go المحدد) ...
قدرات
كان هدفي هو إنشاء واجهة مألوفة لأولئك الذين اعتادوا على Tail / grep ، أي لدعم الأشياء التالية:
- عرض جميع السجلات دون تصفية.
- اترك السلاسل التي تحتوي على سلسلة فرعية ثابتة (علامة
-F
ygrep
). - اترك الأسطر التي تطابق التعبير العادي (علامة
-E
ygrep
). - بشكل افتراضي ، تكون عمليات الفحص بترتيب زمني عكسي ، نظرًا لأن أحدث السجلات عادة ما تكون ذات أهمية أولاً.
- (
-A
,-B
-C
grep
, N , , ). - , (
tail -f | grep
). -
less
,head
,tail
— ; , ;SIGPIPE
, ,tail
,grep
UNIX-.
, - ClickHouse. , lsd kittenhouse, .
. , . , — , ClickHouse ( ~1 ).
, :
CREATE TABLE logs(
category LowCardinality(String), -- ()
time DateTime, --
millis UInt16, -- ( , ..): , ,
..., -- , , ,
message String --
) ENGINE=MergeTree()
ORDER BY (category, time, millis)
, - , , Amazon 2015 . , , , .
:
CREATE TABLE amazon(
review_date Date,
time DateTime DEFAULT toDateTime(toUInt32(review_date) * 86400 + rand() % 86400),
millis UInt16 DEFAULT rand() % 1000,
marketplace LowCardinality(String),
customer_id Int64,
review_id String,
product_id LowCardinality(String),
product_parent Int64,
product_title String,
product_category LowCardinality(String),
star_rating UInt8,
helpful_votes UInt32,
total_votes UInt32,
vine FixedString(1),
verified_purchase FixedString(1),
review_headline String,
review_body String
)
ENGINE=MergeTree()
ORDER BY (time, millis)
SETTINGS index_granularity=8192
, , .
tsv- ~10-20, , 16 . TSV- :
for i in *.tsv; do
echo $i;
tail -n +2 $i | pv |
clickhouse-client --input_format_allow_errors_ratio 0.5 --query='INSERT INTO amazon(marketplace,customer_id,review_id,product_id,product_parent,product_title,product_category,star_rating,helpful_votes,total_votes,vine,verified_purchase,review_headline,review_body,review_date) FORMAT TabSeparated'
done
Persistent Disk ( HDD) Google Cloud 1000 ( , , , SSD ) ~75 / 4 .
- , Google,
, , .
ClickHouse full scan , , , . HTTP- , HTTP: send_progress_in_http_headers=1
. , Go , HTTP 1.0 ( 1.1!) ClickHouse, TCP- ClickHouse, GET /?query=... HTTP/1.0\n\n
- , .
ClickHouse
ClickHouse ( 2019 ?) ORDER BY,
SELECT time, millis, message
FROM logs
WHERE message LIKE '%something%'
ORDER BY time DESC, millis DESC
, message "something", .
, , ClickHouse , , . cancel_http_readonly_queries_on_client_close=1
.
SIGPIPE Go
, , some_cmd | head -n 10
, some_cmd
, head
10 ? : head
, pipe , stdout some_cmd , , «». some_cmd
pipe, SIGPIPE, .
Go , SIGPIPE "signal: SIGPIPE" , , SIGPIPE , , :
ch := make(chan os.Signal)
signal.Notify(ch, syscall.SIGPIPE)
go func() {
<-ch
os.Exit(0)
}()
, - (, , ), grep
-A, -B -C, , , .
, ClickHouse, , , ( , ):
SELECT time,millis,review_body FROM amazon
WHERE (time = '_' AND millis < _) OR (time < '_')
ORDER BY time DESC, millis DESC
LIMIT __
SETTINGS max_threads=1
, ClickHouse , CPU ( ~6 ).
, () , , timestamp, .
logscli ?
Amazon, , :
# , walmart
$ logscli -F 'walmart' | less
# 10 , "terrible"
$ logscli -F terrible -limit 10
# -limit:
$ logscli -F terrible | head -n 10
# , /times [0-9]/, vine
$ logscli -E 'times [0-9]' -where="vine='Y' AND star_rating>4" | less
# "panic" 3
$ logscli -F 'panic' -C 3 | less
# "5-star"
$ logscli -F '5-star' -tailf
( ) github https://github.com/YuriyNasretdinov/logscli. ClickHouse.