Feature/search work by tag #99

PigeonsHouse · 2022-07-05T00:43:16Z

No description provided.

rkun123 · 2022-07-09T08:23:23Z

フォーマッタが既存コードを片っ端からフォーマッティングしてる？
みんなにフォーマッタをちゃんと設定してもらったほうが良いかもね〜

PigeonsHouse · 2022-07-10T04:13:34Z

flake8のlinterが警告出して来るのが目に入るたびに修正しちゃってブランチに直接関係ないコミットも乗っけちゃってますね
フォーマッタの導入は周知したいですけど既存のコードの修正はどのタイミングでやりましょうか？リファクタブランチとか作ります？
~~あとflake8のチェック通すActionsも作りたいなと考えてましたのでissue切っときます．~~
#89 #72
↑似たようなissueはすでにあったので着手するときはこのissueで対応することにします．

PigeonsHouse · 2022-07-10T04:17:05Z

一旦別ブランチでフォーマットは行うことを想定してフォーマットのみの変更点を切り戻すコミットを作ろうと思ってます．

rkun123 · 2022-07-09T08:53:14Z

cruds/works/__init__.py

[COMMENT]
とりあえず良さそう
taggingsテーブルのインデックスが上手に使えてない気がしているので、WorkとTagが増えたときにめっちゃ遅くなりそうな気持ちはある。

toybox=# EXPLAIN ANALYSE SELECT works.* FROM works, taggings, tags WHERE taggings.work_id = works.id AND taggings.tag_id = tags.id AND tags.id IN ('0d435e98-1b63-4a8f-9433-1cfa7840e024', '51216642-ae4e-48d7-80ee-741ec76b0fd5', 'af040833-7ab9-4fff-844a-c234041f3f71') GROUP BY works.id HAVING count(works.id) = 3; QUERY PLAN ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- GroupAggregate (cost=24.97..25.05 rows=1 width=1850) (actual time=0.017..0.018 rows=0 loops=1) Group Key: works.id Filter: (count(works.id) = 3) -> Sort (cost=24.97..24.98 rows=4 width=1850) (actual time=0.016..0.017 rows=0 loops=1) Sort Key: works.id Sort Method: quicksort Memory: 25kB -> Nested Loop (cost=11.00..24.93 rows=4 width=1850) (actual time=0.005..0.006 rows=0 loops=1) -> Hash Join (cost=10.86..21.76 rows=4 width=516) (actual time=0.004..0.005 rows=0 loops=1) Hash Cond: ((taggings.tag_id)::text = (tags.id)::text) -> Seq Scan on taggings (cost=0.00..10.70 rows=70 width=1032) (actual time=0.003..0.004 rows=0 loops=1) -> Hash (cost=10.82..10.82 rows=3 width=516) (never executed) -> Seq Scan on tags (cost=0.00..10.82 rows=3 width=516) (never executed) Filter: ((id)::text = ANY ('{0d435e98-1b63-4a8f-9433-1cfa7840e024,51216642-ae4e-48d7-80ee-741ec76b0fd5,af040833-7ab9-4fff-844a-c234041f3f71}'::text[])) -> Index Scan using works_pkey on works (cost=0.14..0.79 rows=1 width=1850) (never executed) Index Cond: ((id)::text = (taggings.work_id)::text) Planning Time: 0.296 ms Execution Time: 0.112 ms (17 rows)

routers/works/__init__.py

Simo-C3 · 2022-07-19T00:30:06Z

作品一覧取得のエンドポイントと分ける必要がないと思う。既存の作品一覧取得のエンドポイントのクエリパラメータとしてタグを渡して絞り込むような実装でいいと思いました。フロントの実装的にもエンドポイントを分けない方がやりやすいと思います。

PigeonsHouse · 2022-07-19T15:38:27Z

作品一覧取得のエンドポイントにtagsというクエリパラメータを受け取り，tagのidをカンマ区切りで受け取り，選んだタグが全て入っている作品のみ(AND検索)を表示するように修正いたしました．

cruds/works/__init__.py

Simo-C3 · 2022-07-29T05:30:13Z

cruds/works/__init__.py

-        models.Work.visibility != models.Visibility.draft)
+def get_works_by_limit(db: Session, limit: int, visibility: models.Visibility, oldest_id: str, tags: str, auth: bool = False) -> List[Work]:
+    tag_list = tags.split(',')
+    works_orm = db.query(models.Work).filter(models.Tagging.work_id == models.Work.id).filter(models.Tagging.tag_id == models.Tag.id).filter(models.Tag.id.in_(tag_list))


今のコード
sql

SELECT works.id AS works_id, works.title AS works_title, works.description AS works_description, works.description_html AS works_description_html, works.user_id AS works_user_id, works.visibility AS works_visibility, works.created_at AS works_created_at, works.updated_at AS works_updated_at FROM works, taggings, tags WHERE taggings.work_id = works.id AND taggings.tag_id = tags.id AND tags.id IN (__[POSTCOMPILE_id_1]) GROUP BY works.id HAVING count(works.id) = %(count_1)s

↓に書き換え
python

works_orm = db.query(models.Work).filter(models.Tagging.tag_id.in_(tag_list)).filter(models.Tagging.work_id == models.Work.id)

sql

SELECT works.id AS works_id, works.title AS works_title, works.description AS works_description, works.description_html AS works_description_html, works.user_id AS works_user_id, works.visibility AS works_visibility, works.created_at AS works_created_at, works.updated_at AS works_updated_at FROM works, taggings WHERE taggings.tag_id IN (__[POSTCOMPILE_tag_id_1]) AND taggings.work_id = works.id GROUP BY works.id HAVING count(works.id) = %(count_1)s

効率的にtaggingのtag_idで先に絞ってから、work_idで絞る方がいいと思う。上に書いたのは一例だからもっといい他の方法があるかも

ここ複雑だし、生SQLで書いたほうが可読性上がったりしないかと思った
JOINでやるのが良いのかな〜

SELECT ... FROM works INNER JOIN taggings ON taggings.work_id = works.id WHERE taggings.tag_id IN ? GROUP BY work.id HAVING count(works.id) = ? -- ここはtag_idsの数

↑動くかは知らん

orm系はsqlで先に考えて書き換えた方がいい気がします。バイトの時もjoinとかネストとか複雑なsqlが必要になった時にsql文作ってからormの記法に書き換えてました。

生のsqlを書くのが可読性以外（セキュリティー、安定性）でマイナスにならなければ生sqlでもいいと思います

一応この部分のORMはSQLを書いた後でORMに書き換える手法で記述しました．
シモと同意で，セキュリティ的に問題が無いのかという不安があるのと，また，他の記述で生のSQLを採用する基準がはっきりしないので(ここ以外で生SQL使わない方針なら心配ないですけど)，一括で統一したほうが楽かなとも思いました．
その点問題が解消するなら可読性の観点からも生SQLもありかと思います．

作品の絞り込み方の修正は対応しました．

rkun123

[COMMENT] シモくんコメントのとこだけ直してもらえるとよさそう

Simo-C3 · 2022-08-02T06:15:35Z

cruds/works/__init__.py

+    if tags:
+        tag_list = tags.split(',')
+        works_orm = works_orm.filter(models.Tagging.tag_id.in_(tag_list)).filter(models.Tagging.work_id == models.Work.id)
+        works_orm = works_orm.group_by(models.Work.id).having(func.count(models.Work.id) == len(tag_list))


これって何してるん？
いまいち分かってなくて、、、

tag_list = tags.split(',')

','で区切ったtag_idを配列にして，

works_orm = works_orm.filter(models.Tagging.tag_id.in_(tag_list)).filter(models.Tagging.work_id == models.Work.id)

Taggingテーブルからそのタグが付いたデータを抽出して，そのデータのwork_idと一致する作品情報をWorkテーブルから持ってきて，

works_orm = works_orm.group_by(models.Work.id).having(func.count(models.Work.id) == len(tag_list))

重複してる作品をGROUPで一纏めにして，重複したデータ数がタグの数と一致したもので更に絞り込んでます．
1つの作品と検索してるタグそれぞれのTaggingデータがあればちょうどタグの数の分だけ重複するから最後のhavingがついてます．

SQLっぽく書くと，

SELECT works.* FROM works, tagging WHERE tagging.tag_id in ("tagid1", ..., "tagid2") AND tagging.work_id = works.id GROUP BY works.id HAVING count(works.id) = 4; -- 4はタグの数

って感じです．

works_orm = works_orm.group_by(models.Work.id).having(func.count(models.Work.id) == len(tag_list))
重複してる作品をGROUPで一纏めにして，重複したデータ数がタグの数と一致したもので更に絞り込んでます．
1つの作品と検索してるタグそれぞれのTaggingデータがあればちょうどタグの数の分だけ重複するから最後のhavingがついてます．

なるほど、理解

Simo-C3 · 2022-08-02T06:16:40Z

cruds/works/__init__.py

-    works_orm = db.query(models.Work).order_by(models.Work.created_at).filter(
-        models.Work.visibility != models.Visibility.draft)
+def get_works_by_limit(db: Session, limit: int, visibility: models.Visibility, oldest_id: str, tags: str, auth: bool = False) -> List[Work]:
+    works_orm = db.query(models.Work).order_by(desc(models.Work.created_at)).filter(models.Work.visibility != models.Visibility.draft)


タグで絞り込んで作品数が減った後にソートした方が処理が早い気がする

sqlalchemyはall()やfirst()などが付くまではSQLを構成するだけで実行はされないため全て記述した順番通りに実行されるわけではないと記憶しております．
また，そもそもPostgreSQLではソートを行ったあとで絞り込みを行うという記述は実行することが出来ないため，正常に動作していることからも問題ないと考えています．

そっか
ほんまやわw

PigeonsHouse added 5 commits July 4, 2022 21:46

[add] tagからwork検索するエンドポイント追加

c789865

[add] ページネーションの追加

55ba83a

[fix] 一部修正

5841f38

[add] テストケースの追加とそれに伴った修正

f8d0107

[delete] printの削除

ed342b8

PigeonsHouse requested a review from rkun123 July 5, 2022 00:43

PigeonsHouse self-assigned this Jul 5, 2022

PigeonsHouse linked an issue Jul 5, 2022 that may be closed by this pull request

workのタグ検索機能 #81

Closed

PigeonsHouse added this to the α milestone Jul 5, 2022

PigeonsHouse requested a review from Simo-C3 July 6, 2022 00:04

PigeonsHouse closed this Jul 10, 2022

PigeonsHouse reopened this Jul 10, 2022

[revert] linterの修正箇所の切り戻し

fc3f7fa

PigeonsHouse force-pushed the feature/search_work_by_tag branch from 1cc762f to fc3f7fa Compare July 11, 2022 10:20

[revert] print削除の切り戻し

7dd2398

PigeonsHouse force-pushed the feature/search_work_by_tag branch from d583aef to 7dd2398 Compare July 12, 2022 02:02

Merge branch 'main' into feature/search_work_by_tag

923b7c5

rkun123 reviewed Jul 19, 2022

View reviewed changes

[update] レビューの対応

4a3b763

Simo-C3 reviewed Jul 29, 2022

View reviewed changes

cruds/works/__init__.py Outdated Show resolved Hide resolved

Simo-C3 reviewed Jul 29, 2022

View reviewed changes

rkun123 reviewed Jul 30, 2022

View reviewed changes

This was referenced Jul 31, 2022

users/{user_id}/worksの実装 #97

Closed

users/@me/worksの実装 #96

Closed

[fix] tagがなかったときの処理追加

4d3dedc

[fix] 作品絞り込みのアルゴリズム変更

793e6c0

Simo-C3 reviewed Aug 2, 2022

View reviewed changes

PigeonsHouse requested review from rkun123 and Simo-C3 August 3, 2022 02:17

Simo-C3 merged commit 478cf4b into main Aug 3, 2022

Simo-C3 mentioned this pull request Aug 14, 2022

taggingのindexがうまく使えていない問題 #107

Open

Simo-C3 deleted the feature/search_work_by_tag branch October 13, 2022 12:04

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Feature/search work by tag #99

Feature/search work by tag #99

PigeonsHouse commented Jul 5, 2022

rkun123 commented Jul 9, 2022

PigeonsHouse commented Jul 10, 2022 •

edited

Loading

PigeonsHouse commented Jul 10, 2022

rkun123 Jul 9, 2022 •

edited

Loading

Simo-C3 commented Jul 19, 2022 •

edited

Loading

PigeonsHouse commented Jul 19, 2022

Simo-C3 Jul 29, 2022 •

edited

Loading

rkun123 Jul 30, 2022

rkun123 Jul 30, 2022

Simo-C3 Jul 31, 2022

PigeonsHouse Aug 2, 2022

PigeonsHouse Aug 2, 2022

rkun123 left a comment

Simo-C3 Aug 2, 2022

PigeonsHouse Aug 3, 2022

Simo-C3 Aug 3, 2022 •

edited

Loading

Simo-C3 Aug 2, 2022

PigeonsHouse Aug 3, 2022

Simo-C3 Aug 3, 2022

Feature/search work by tag #99

Feature/search work by tag #99

Conversation

PigeonsHouse commented Jul 5, 2022

rkun123 commented Jul 9, 2022

PigeonsHouse commented Jul 10, 2022 • edited Loading

PigeonsHouse commented Jul 10, 2022

rkun123 Jul 9, 2022 • edited Loading

Choose a reason for hiding this comment

Simo-C3 commented Jul 19, 2022 • edited Loading

PigeonsHouse commented Jul 19, 2022

Simo-C3 Jul 29, 2022 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

rkun123 left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Simo-C3 Aug 3, 2022 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

PigeonsHouse commented Jul 10, 2022 •

edited

Loading

rkun123 Jul 9, 2022 •

edited

Loading

Simo-C3 commented Jul 19, 2022 •

edited

Loading

Simo-C3 Jul 29, 2022 •

edited

Loading

Simo-C3 Aug 3, 2022 •

edited

Loading